Summary
오늘의 AI 소식에서는 Hugging Face의 새로운 데이터셋 FineWeb과 FineWeb-Edu의 출시, OpenAI의 차세대 AI 모델 개발, 그리고 기업에서 생성형 AI의 ROI 극대화 방법을 다룹니다.
FineWeb 기술 보고서 및 FineWeb Edu 출시
Hugging Face 블로그, 2024년 5월 31일
- FineWeb: 15조 토큰 규모의 대규모 영어 웹 데이터셋, CommonCrawl에서 파생
- FineWeb-Edu: 1.3조 및 5.4조 고품질 교육용 데이터셋
- 교육 콘텐츠 필터링을 위한 텍스트 분류기 사용, Llama-3-70B-Instruct로 품질 평가
- 독립적인 MinHash 중복 제거 방법 사용
- FineWeb-Edu는 MMLU, ARC, OpenBookQA에서 다른 데이터셋을 능가
- ODC-By 1.0 라이센스로 제공, 완전 재현 가능
OpenAI의 새로운 플래그십 AI 모델 훈련 시작
뉴욕 타임즈, 2024년 5월 28일
- OpenAI, GPT-4 후속 모델 개발 착수
- 새로운 모델은 ChatGPT를 포함한 여러 AI 제품의 엔진으로 사용 예정
- 새롭게 구성된 안전 및 보안 위원회가 기술의 위험성 관리 방안 논의
- Scarlett Johansson의 목소리와 유사한 음성을 사용한 GPT-4o 모델 논란
- 차세대 모델은 향후 9개월에서 1년 이상 후에 출시 예상
ROI 극대화를 위한 전사적 생성형 AI 구축 모범사례
Gartner 보고서, 2024년 4월
- 활용 사례 우선순위 설정 프로세스 구축
- 구축 혹은 구매를 위한 의사 결정 프레임워크 개발
- 확장성을 위한 시범 운영
- 유연한 생성형 AI 플랫폼 아키텍처 설계
- ‘책임감 있는 AI’ 도입
- 데이터 및 AI 리터러시에 대한 투자 필요
“정규직 40%는 AI 사업 인력”…AI 컴퍼니로 거듭난 SKT
다음 소식, 2024년 5월 9일
- SK텔레콤, 전체 정규직의 40%가 AI 관련 인력으로 구성
- 1분기 매출 4조4746억원, 영업이익 4985억원 기록
- 데이터센터와 클라우드 사업 매출 각각 25.6%, 38.3% 증가
- AI 서비스 앱 ‘에이닷’ 누적 가입자 수 400만명 달성
- 글로벌 텔코 AI 얼라이언스와 협력, AI 개인비서 서비스 현지화 계획
이상으로 오늘의 AI 소식를 마칩니다. 더 자세한 내용은 각 링크를 참조하세요.
Sources
This GPT assists users by creating a detailed daily newspaper in Korean based on provided links. It follows these steps: read the content, summarize each content with detailed points, and write a report. The report format is: # AI News for (today's date), ## Summary (overall short summary), ## Link1 Title, link, date - detailed summary1, - detailed summary2, - detailed summary..N, ## Link2 Title, link, date - detailed summary1, - detailed summary2, - detailed point..N, etc. The report should be written in Korean and use the 개조식 문체 style. give the very deep details for each link as much as possible. make summary with good details, note company name next to date if available.1 | ### |