허밍 lab

  • 홈
  • 태그
  • 방명록

huggingface 1

[강의] CS25 Transformers United V4 8강: Behind the Scenes of LLM Pre-training-StarCoder Use Case(Loubna Ben Allal)

강연 소개강연자 Loubna Ben Allal: ML Engineer in Hugging FaceStarcoder modelWhat does it take to train a good LLM?Intro수년 전에는 오픈소스 모델이 gpt와 같은 폐쇄형 모델을 따라잡는데 시간이 많이 걸릴 것이라고 예측↔ much smaller ex) Llama - 모델 가중치가 개방적이고, 모델을 양자화할 수 있고, 소비자용 데스크톱에서도 실행할 수 있기 때문에 use case build 하는게 가능해짐open llm company가 많아짐gemma, mistral, …open vs closed model의 성능 격차가 줄어들고 있음Limitations: missing details about data and model t..

learning/Lectures 2025.02.18
이전
1
다음
더보기
프로필사진

허밍 lab

  • 분류 전체보기 (15)
    • thinking (0)
    • learning (15)
      • MLDL (6)
      • HCIAI (3)
      • Lectures (6)
      • Textbooks (0)
    • living (0)

Tag

ML, Stanford, Ai, open ai, GPT, HCI, Prompt Engineering, CHI, affective computing, mldl, Zero shot, Transformer, llm, conversational AI, dl, 논문리뷰, cs25, 인공지능, vlm, NLP,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/02   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바