Summary
오늘의 소식에서는 인공지능 모델 GLM-4-9B의 성능과 다언어 지원, 트랜스포머의 알고리즘적 추론 능력, 한국어 RAG 평가 데이터셋, 인텔의 제온6 프로세서 출시, 엔비디아의 차세대 AI 전용칩, AMD의 새로운 라이젠 AI 300 칩, LLM의 신뢰도 표현 개선 연구, 그리고 Skywork-MoE 모델의 최신 업데이트에 대해 다룹니다.
GLM-4-9B 모델 소개
링크
2024-06-04, Zhipu AI
- GLM-4-9B는 Zhipu AI에서 출시한 최신 프리트레인 모델 시리즈의 오픈소스 버전.
- 의미, 수학, 추론, 코드 및 지식 데이터셋 평가에서 Llama-3-8B보다 우수한 성능을 보임.
- GLM-4-9B-Chat 버전은 웹 브라우징, 코드 실행, 맞춤형 도구 호출, 긴 텍스트 추론 등의 고급 기능을 포함.
- 26개 언어를 지원하며, GLM-4V-9B는 다이얼로그 능력을 갖춘 멀티모달 모델.
- GLM-4V-9B는 GPT-4-turbo-2024-04-09, Gemini 1.0 Pro, Qwen-VL-Max, Claude 3 Opus보다 뛰어난 성능을 입증.
Understanding Transformer Reasoning Capabilities via Graph Algorithms
링크
2024-05-28, Google Research
- 트랜스포머 기반 신경망의 알고리즘적 추론 능력에 대한 이론적 이해를 조사.
- 네트워크 깊이, 폭, 추가 토큰 수에 따른 알고리즘 문제 해결 능력을 분석.
- 그래프 연결성 같은 과제에 대해 로그 깊이가 필요하며, 작은 임베딩 차원의 단일 레이어 트랜스포머가 컨텍스트 검색 작업을 해결 가능.
- GraphQA 벤치마크를 사용한 실증적 증거 제시.
Allganize RAG 리더보드
링크
2024-06-04, Allganize
- 5개 도메인(금융, 공공, 의료, 법률, 커머스)에 대한 한국어 RAG 성능 평가.
- 기존 RAG는 테이블과 이미지에 대한 질문 답변에 취약.
- Allganize는 RAG 평가 데이터를 공개하여 도메인 맞춤형 성능 평가 가능.
- 문서 업로드 후 자체 질문 사용해 성능 측정.
Fine-tune Embedding models for RAG
링크
2024-06-04, Phil Schmid
- RAG 애플리케이션을 위한 임베딩 모델 커스터마이징 방법 소개.
- Matryoshka Representation Learning을 활용하여 효율성 증대.
- 금융 RAG 애플리케이션을 위한 임베딩 모델 파인튜닝 과정 설명.
- 새로운 Sentence Transformers 3 릴리스로 인해 파인튜닝이 더욱 간편해짐.
인텔, 제온6 ‘시에라 포레스트’ 출시
링크
2024-06-04, 디지털데일리
- 인텔, 타이베이에서 데이터센터 및 AI 생태계 혁신 기술 공개.
- 제온 6 프로세서, E-코어 및 P-코어 모델 설계로 고밀도 스케일아웃 워크로드 처리 가능.
- 인텔 제온 6 E-코어, 전력 비용 절감과 효율적 컴퓨팅 제공.
- DDR5, PCIe 5.0, UPI 및 CXL 기술 지원.
엔비디아 차세대 AI 전용칩 공개
링크
2024-06-04, 김정우 기자
- 뱅크오브아메리카, 엔비디아 목표가 1500달러로 상향.
- 엔비디아의 차차세대 AI 전용칩 발표로 시장 지배력 강화 예상.
- 엔비디아 주가 1154달러로 최고치 경신.
NVIDIA Collaborates with Hugging Face to Simplify Generative AI Model Deployments
링크
2024-06-03, NVIDIA
- NVIDIA, Hugging Face와 협력하여 생성 AI 모델 배포 간소화.
- NVIDIA NIM, 저지연, 고처리량 AI 추론 제공.
- Llama 3 8B 및 Llama 3 70B 모델 Hugging Face에서 몇 번의 클릭으로 배포 가능.
xAI, 시리즈 B 펀딩에서 60억 달러 조달
2024-06-04
- xAI, 시리즈 B 펀딩 라운드에서 60억 달러 조달, 기업가치 180억 달러로 평가.
- 펀딩 자금은 첫 제품 출시, 고급 인프라 구축, 연구 개발 가속화에 사용될 예정.
- OpenAI, Anthropic, ScaleAI와 경쟁.
AMD, 새로운 라이젠 AI 300 칩 공개
링크
2024-06-03, Windows Central
- AMD, 컴퓨텍스 2024에서 라이젠 AI 300 모바일 프로세서 공개.
- 새로운 Zen 5 아키텍처 기반, Copilot+ 호환.
- 라이젠 AI 9 HX 370 및 라이젠 AI 9 365, 각각 50 TOPS 성능 제공.
- Acer, ASUS, HP, Lenovo, MSI의 다양한 노트북 모델에 채택될 예정.
SaySelf: Teaching LLMs to Express Confidence with Self-Reflective Rationales
링크
2024-05-31, Tianyang Xu 외
- SaySelf는 LLM이 정확한 신뢰도 추정치를 표현하도록 교육하는 프레임워크.
- 강화 학습을 통해 신뢰도 추정치를 보정, 과도한 신뢰도 패널티 부여.
- 실험 결과, 신뢰도 보정 오류 감소 및 작업 성능 유지.
Skywork-MoE 모델 업데이트
링크
2024-06-03, SkyworkAI
- Skywork-MoE는 1460억 개의 파라미터와 22억 개의 활성화된 파라미터를 가진 모델.
- 전문가 다변화를 촉진하는 Gating Logit Normalization과 보조 손실 계수 조정을 위한 Adaptive Auxiliary Loss Coefficients 도입.
- Grok-1, DBRX, Mistral 8*22, Deepseek-V2보다 우수한 성능을 발휘.
Sources
This GPT assists users by creating a detailed daily newspaper in Korean based on provided links. It follows these steps: read the content, summarize each content with detailed points, and write a report. The report format is: # AI News for (today's date), ## Summary (overall short summary), ## Link1 Title, link, date - detailed summary1, - detailed summary2, - detailed summary..N, ## Link2 Title, link, date - detailed summary1, - detailed summary2, - detailed point..N, etc. The report should be written in Korean and use the 개조식 문체 style. give the very deep details for each link as much as possible. make summary with good details, note company name next to date if available.1 | ### |