Summary
OpenAI에서는 데이터 인덱싱과 쿼리 기능을 제공하는 실시간 분석 데이터베이스인 Rockset을 인수하여 자사의 검색 인프라를 강화할 예정입니다. Arcee.ai에서는 새로운 Qwen2 7B 기반의 커스텀 모델 Arcee-Spark를 출시하여 AGIEval과 MT-Bench 등에서 우수한 성능을 보였으며, Nous Research는 Llama-3 Instruct와 통합한 Hermes-2 Theta 70B 모델을 발표하여 다양한 벤치마크에서 뛰어난 성능을 입증했습니다. BBC는 AI가 인간의 일자리에 미치는 영향을 보도하며, AI 자동화로 인한 해고 사례를 조명했습니다. 또한 GenQA는 다양한 주제에 대해 자동으로 질문과 답변을 생성하는 데이터셋을 공개했습니다. MOFA-Video는 컨트롤 가능한 이미지 애니메이션 생성 기술을 선보였으며, MARS5 TTS는 뛰어난 프로소디 제어 기능을 갖춘 오픈 소스 음성 합성 모델을 발표했습니다.
OpenAI, Rockset 인수
OpenAI, Rockset 인수
링크, 2024년 6월 21일,
OpenAI
- OpenAI는 Rockset을 인수하여 자사의 검색 인프라를 강화할 계획
- Rockset은 실시간 데이터 인덱싱 및 쿼리 기능을 제공하는 분석 데이터베이스
- Rockset의 기술은 OpenAI 제품의 검색 인프라에 통합될 예정
- Rockset 팀의 일부 멤버들이 OpenAI에 합류
- Brad Lightcap, OpenAI COO는 Rockset의 인프라가 기업들이 데이터를 실행 가능한 인텔리전스로 변환하는 데 도움을 줄 것이라고 발표
- Venkat Venkataramani, Rockset CEO는 OpenAI와의 협력을 통해 사용자, 기업, 개발자들이 데이터를 최대한 활용할 수 있게 될 것이라고 발표
Arcee.ai, Arcee-Spark 출시
Arcee-Spark 출시
링크, 2024년 6월,
Arcee.ai
- Qwen2 7B 기반의 커스텀 모델 Arcee-Spark 출시
- 1.8백만 샘플로 미세 조정 후 Qwen2-7B-Instruct와 병합
- Direct Preference Optimization (DPO)로 추가 훈련
- AGIEval 51.11, MT-Bench 8.46, BigBenchHard 45.78, EQ-Bench 71.4 점수 달성
- 작은 크기에도 불구하고 뛰어난 성능 제공
- 실시간 애플리케이션, 엣지 컴퓨팅, 비용 효율적인 스케일링 등에 이상적
- GPT-3.5보다 많은 작업에서 우수한 성능을 보임
- 대화의 많은 회전이 필요한 작업이나 대량의 텍스트 작업에 적합한 128k 토큰의 컨텍스트 길이 제공
Nous Research, Hermes-2 Theta 70B 발표
Hermes-2 Theta 70B 발표
링크, 2024년 6월,
Nous Research
- Hermes-2 Θ (Theta) 70B 모델 발표
- Hermes 2 Pro 모델과 Meta의 Llama-3 Instruct 모델을 통합하여 개발
- 강화 학습을 통해 성능 향상
- 다양한 벤치마크에서 Llama-3 Instruct 70B보다 우수한 성능을 입증
- Nous Research와 Charles Goddard, Arcee AI 팀의 협력으로 개발
AI가 인간의 일자리에 미치는 영향
AI가 인간의 일자리에 미치는 영향
링크, 2024년 6월 16일,
BBC
- AI 자동화 도입 후 60명 중 59명 해고 사례 보고
- 마지막 남은 한 명도 나중에 해고됨
- AI가 작성한 문서를 인간이 수정하는 작업 증가
- Benjamin Miller의 사례를 통해 AI 도입으로 인한 일자리 감소 사례 소개
- AI와 인간의 협업이 새로운 일자리 창출 가능성 제시
- 초기 단계의 AI 도입으로 인해 인간의 일자리가 감소했으나, 향후 협업의 가능성도 존재
- 저임금으로 AI가 작성한 글을 수정하는 새로운 직업 등장
GenQA: 다양한 주제에 대한 자동 질문 생성
GenQA 데이터셋 공개
링크, 2024년 6월 15일,
GenQA
- 10백만 개 이상의 청소 및 중복 제거된 명령어 데이터셋 공개
- 다양한 주제에 대해 자동으로 질문과 답변 생성
- Gemini Pro 1.0을 사용하여 데이터 생성
- AlpacaEval 2.0과 MT-Bench에서 UltraChat과 WizardLM보다 우수한 성능 달성
- 데이터셋, 생성기 프롬프트 및 모델 체크포인트 공개
- 주제 다양성을 높이기 위해 “be creative”, “be smart” 등의 접미사를 추가하여 데이터 생성
MOFA-Video: 컨트롤 가능한 이미지 애니메이션
MOFA-Video 발표
링크, 2024년 6월 2일,
Muyao Niu 외
- MOFA-Video는 주어진 이미지에서 다양한 추가 신호를 사용하여 비디오를 생성하는 기술 발표
- 인간 랜드마크 참조, 수동 경로 및 다른 제공된 비디오 등의 신호를 사용하여 비디오 생성 가능
- 다양한 모션 도메인에서 작동하며 강력한 제어 기능 제공
- MOFA-어댑터를 사용하여 비디오 생성 파이프라인에서 생성된 모션 제어
- 수동 경로 및 인간 랜드마크를 위한 두 개의 모션 어댑터 개별 훈련
- MOFA-어댑터가 다양한 도메인에서 함께 작동 가능
MARS5 TTS: 고도의 프로소디 제어 음성 합성
MARS5 TTS 발표
링크, 2024년 6월,
CAMB.AI
- MARS5 TTS는 뛰어난 프로소디 제어 기능을 갖춘 오픈 소스 텍스트 음성 변환(TTS) 모델 발표
- 5초 이하의 음성으로 음성 클로닝 가능
- 이중 단계 Auto-Regressive(750M) + Non-Auto Regressive(450M) 모델 아키텍처
- 구두점, 멈춤 등을 제어할 수 있는 BPE 토크나이저 사용
- AR 모델이 L0 코스 토큰을 예측하고, NAR DDPM 모델이 이를 세밀하게 조정한 후 보코더를 통해 최종 오디오 생성
- 텍스트와 참조 오디오를 함께 사용하여 자연스러운 발음 및 억양 제어 가능
- 스포츠 해설, 애니메이션 등 다양한 시나리오에서 뛰어난 성능 발휘
Sources
This GPT assists users by creating a detailed daily newspaper in Korean based on provided links. It follows these steps: read the content, summarize each content with detailed points, and write a report. The report format is:
(today’s date in 년 월 일) AI 소식,
Summary
(overall short summary, make summary with good details. for Summary section, explain the details starting with company name, e.g. OpenAI에서는 ~~~를 발표하였습니다.)
Title,
한글제목
링크, date,
company name
- detailed summary1, (개조식 문체 사용)
- detailed summary2, (개조식 문체 사용)
… - detailed summary N, (개조식 문체 사용)
Title,
한글제목
링크, date,
company name
- detailed summary1, (개조식 문체 사용)
- detailed summary2, (개조식 문체 사용)
… - detailed summary N, (개조식 문체 사용)
…
1 | ### |