코스피

5,522.27

  • 167.78
  • 3.13%
코스닥

1,125.99

  • 11.12
  • 1.00%
1/4

초거대 AI 비용 낮춘다…KAIST, 신기술 개발

페이스북 노출 0

핀(구독)!


뉴스 듣기-

지금 보시는 뉴스를 읽어드립니다.

이동 통신망을 이용하여 음성을 재생하면 별도의 데이터 통화료가 부과될 수 있습니다.

초거대 AI 비용 낮춘다…KAIST, 신기술 개발

주요 기사

    글자 크기 설정

    번역-

    G언어 선택

    • 한국어
    • 영어
    • 일본어
    • 중국어(간체)
    • 중국어(번체)
    • 베트남어
    KAIST는 한동수 전기및전자공학부 교수팀이 챗GPT 등 대규모언어모델(LLM) 인프라 비용을 크게 낮추는 기술 ‘스펙엣지’를 개발했다고 28일 밝혔다.

    현재 LLM 서비스는 대형 데이터센터 내 고가의 그래픽처리장치(GPU)가 서버를 거쳐 휴대폰 등 모바일 기기로 추론 결과를 전송한다. 데이터센터에 과부하가 걸리고 전력 소모도 많아지는 구조다. 스펙엣지는 역으로 엔비디아 RTX4090 등과 같이 PC나 소형 서버 내 ‘엣지 GPU’가 토큰을 생성하면 데이터센터가 이를 검증한다. KAIST에 따르면 스펙엣지를 사용할 경우 토큰당 생성 비용이 67.6% 줄고 서버 처리량은 2.22배 향상됐다. 연구 성과는 이달 초 미국 샌디에이고에서 열린 인공지능(AI) 분야 저명 학회인 신경정보처리시스템학회(NeurIPS)에서 ‘주목할 논문’으로 발표됐다.


    이해성 기자 ihs@hankyung.com










    실시간 관련뉴스