Summary
OpenAI에서는 최첨단 AI 모델의 보안 인프라를 구축하는 방법에 대해 발표하였습니다. Google Research에서는 생성 AI를 활용한 의료 영상 모델의 이해를 연구하였으며, Meta의 NLLB 팀은 200개 언어로 확장된 신경망 기계 번역 모델을 개발하였습니다. Stability AI는 새로운 음향 디자인을 위한 Stable Audio Open 1.0을 출시하였습니다. 엔프락스의 연구에 따르면, Agile 소프트웨어 프로젝트의 실패율이 268% 더 높다는 결과가 나왔습니다. Anthropic은 선거 관련 위험을 테스트하고 완화하는 방법을 설명하였습니다. Hugging Face의 Qwen 팀은 Meta Llama 3를 능가하는 새로운 다중언어 모델을 출시하였습니다. Intel은 Alibaba Cloud의 Qwen2 대규모 언어 모델에 최적화된 AI 솔루션을 발표하였습니다.
Scaling neural machine translation to 200 languages
200개 언어로 확장된 신경망 기계 번역
링크, 2024년 6월 5일
META, NLLB 팀
- 신경망 기계 번역(NMT) 시스템은 다국어 역량을 활용하여 무작위 번역을 수행할 수 있음.
- 고품질 NMT를 확장하려면 대량의 이중 언어 데이터를 필요로 함.
- 저자원 언어에 대한 번역 품질 향상을 위해 새로운 채굴 기법을 사용하여 데이터 수집.
- 과적합 방지를 위한 다중 아키텍처 및 훈련 개선 기법을 도입.
- FLORES-200 자동 벤치마크, XSTS 인간 평가 메트릭 및 독성 검출기를 사용하여 모델 성능 평가.
- BLEU 점수 기준으로 이전 모델 대비 44% 향상된 번역 품질 달성.
- 비상업적 사용을 위한 기여물을 자유롭게 제공하여 보편적 번역 시스템 개발의 기초 마련.
Using generative AI to investigate medical imagery models and datasets
생성 AI를 활용한 의료 영상 모델 및 데이터셋 연구
링크, 2024년 6월 5일
Google Research
- 의료 영상에서 AI 모델을 이해하기 위한 프레임워크 제시.
- StylEx 생성 모델을 기반으로 시각적 설명 제공.
- 외부 눈 사진, 안저 사진, 흉부 X선(CXR) 이미지에서 예측 작업 테스트.
- 4단계 프레임워크: 분류기 훈련, StylEx 훈련, 자동 속성 선택, 전문가 패널 검토.
- 알려진 속성(양성 통제) 및 잠재적 새 신호 발견.
- 데이터셋 편향 및 사회문화적 요인 고려 필요 강조.
- AI 모델의 설명 가능성 향상 및 새로운 의료 진단 방법 발견.
VeLoRA: Memory Efficient Training using Rank-1 Sub-Token Projections
VeLoRA: 랭크-1 서브-토큰 프로젝션을 사용한 메모리 효율적인 훈련
링크, 2024년 5월 28일
Roy Miles, Pradyumna Reddy, Ismail Elezi, Jiankang Deng
- 대규모 언어 모델(LLM)의 훈련과 미세 조정이 매우 높은 계산 및 메모리 집약적임.
- 백프로파게이션 중 중간 활성화를 과도하게 압축하여 성능 저하 없이 모델 수렴 달성.
- 랭크-1 서브-토큰 프로젝션을 사용하여 메모리 효율적인 알고리즘 개발.
- VTAB-1k 벤치마크에서 QLoRA를 능가하는 성능 확인.
- 대규모 C4 데이터셋에서 다른 메모리 효율적인 사전 훈련 방법과 경쟁력 있는 성능 보임.
Securing Research Infrastructure for Advanced AI
최첨단 AI 연구 인프라 보안
링크, 2024년 6월 5일
OpenAI
- AI 연구 슈퍼컴퓨터의 보안 아키텍처 개요 제공.
- Azure 및 Kubernetes를 활용한 연구 인프라 보안 설계.
- Azure Entra ID를 통한 세션 생성 시 위험 기반 검증.
- Kubernetes 역할 기반 접근 제어 정책 적용.
- 민감한 데이터 보호를 위한 키 관리 서비스 사용.
- AccessManager 서비스를 통한 내부 승인 및 접근 관리.
- CI/CD 파이프라인 보안을 강화하여 잠재적 위협에 대한 탄력성 증가.
- 고도의 방어 접근 방식을 통해 연구 모델 가중치 보호.
Stability AI debuts new Stable Audio Open for sound design
Stability AI, 음향 디자인을 위한 Stable Audio Open 출시
링크, 2024년 6월 5일
Stability AI
- Stable Audio Open 1.0 출시.
- Stable Audio Open은 소리 효과와 같은 짧은 오디오 생성에 중점.
- FreeSound 및 Free Music Archive의 오디오 데이터를 사용하여 모델 훈련.
- 사용자 정의 오디오 데이터로 모델을 미세 조정할 수 있는 기능 제공.
- 연구 및 창의적 사용을 촉진하기 위해 안정적인 오디오 모델 제공.
Study finds 268% higher failure rates for Agile software projects
연구 결과, Agile 소프트웨어 프로젝트의 실패율이 268% 더 높음
링크, 2024년 6월 5일
Engprax
- Agile 방식의 소프트웨어 프로젝트 실패율이 비Agile 방식에 비해 268% 더 높다는 연구 결과.
- 명확한 요구 사항을 문서화한 프로젝트는 성공 확률이 97% 더 높음.
- 요구 사항 명확성 및 개발자 소진 방지 중요성 강조.
Qwen2: The most impactful open LLM release since Meta Llama 3
Qwen2: Meta Llama 3 이후 가장 영향력 있는 오픈 LLM 출시
링크, 2024년 6월 6일
Hugging Face
- Qwen2 다중언어 모델 가족 출시.
- 5가지 크기: 0.5B, 1.5B, 7B, 57B-14B(MoE), 72B.
- 29개 언어 지원 및 다양한 학술 및 대화 벤치마크에서 최고 성능 달성.
- Apache 2.0 라이선스 아래 대부분의 모델 제공.
- Hugging Face에서 사용 가능.
Extracting Concepts from GPT-4
GPT-4에서 개념 추출
링크, 2024년 6월 6일
OpenAI
- GPT-4의 내부 표현을 1,600만 개의 해석 가능한 패턴으로 분해하는 새로운 방법 개발.
- 대규모 희소 오토인코더 훈련 방법론 도입.
- 다양한 해석 가능한 특징 시각화 제공.
- 향후 모델의 신뢰성과 조종 가능성 향상 기대.
Testing and mitigating elections-related risks
선거 관련 위험 테스트 및 완화
링크, 2024년 6월 6일
Anthropic
- 선거 무결성을 위한 AI 모델 테스트 및 위험 완화 방법 설명.
- 정책 취약성 테스트(PVT) 및 대규모 자동 평가를 결합한 프로세스 도입.
- 선거 관리, 정치적 중립성, 유해 쿼리에 대한 대응 능력 평가.
- 모형 응답의 정확성 및 권위 있는 출처로의 참조율 향상.
AI in software engineering at Google: Progress and the path ahead
Google의 소프트웨어 공학에서 AI의 진전과 앞으로의 길
링크, 2024년 6월 6일
Google Research
- Google 내부 도구에서 AI 기반 소프트웨어 엔지니어링 지원 기능 개선.
- 코드 완성을 통한 생산성 향상 및 사용 데이터 기반 모델 튜닝.
- 코드 리뷰 댓글 해결 및 코드 붙여넣기 자동화 기능 도입.
- 자연어를 통한 IDE 명령 및 빌드 실패 예측 기능 개발.
GraphRAG: Unlocking LLM discovery on narrative private data
GraphRAG: 서사적 비공개 데이터에서 LLM 발견 활성화
링크, 2024년 2월 13일
Microsoft Research
- Microsoft Research에서 개발한 GraphRAG 소개.
- LLM 생성 지식 그래프를 사용하여 질문 및 응답 성능 향상.
- 복잡한 정보 문서 분석 시 뛰어난 성능 발휘.
- 개인 데이터셋에 대해 문맥과 근거를 바탕으로 한 정확한 정보 제공.
Optimization of Intel AI Solutions for Alibaba Cloud’s Qwen2 Large Language Models
Alibaba Cloud의 Qwen2 대규모 언어 모델을 위한 Intel AI 솔루션 최적화
링크, 2024년 6월 6일
Intel
- Alibaba Cloud의 Qwen2 LLM을 위한 Intel AI 솔루션 최적화 발표.
- 고성능 융합 커널, 고급 양자화 기술, 키-값 캐싱 및 텐서 병렬화 등을 사용한 최적화.
- Intel Gaudi 2 AI 가속기 및 Xeon 프로세서에서 Qwen2 모델 벤치마크 수행.
- AI PC에서 Qwen2 1.5B 모델의 인퍼런스 성능 시연.
Sources
This GPT assists users by creating a detailed daily newspaper in Korean based on provided links. It follows these steps: read the content, summarize each content with detailed points, and write a report. The report format is:1 | # (today's date in 년 월 일) AI 소식, |
1 | ### |