Meta에서는 Llama 3.1을 출시하였으며, 8B, 70B 및 405B 크기의 모델로 제공됩니다. 이 모델은 다국어 지원과 상업적 사용이 가능하며, 효율적인 추론을 위해 양자화된 버전을 제공합니다. DeepSeek에서는 DeepSeek-V2-Chat-0628 모델을 개선하여 L...
SummaryAnthropic에서는 안드로이드용 Claude 앱을 출시하여 강력한 AI 모델 Claude 3.5 Sonnet의 기능을 안드로이드 사용자들에게 제공합니다. Mistral AI는 코드 생성에 특화된 Codestral Mamba 모델과 수학적 추론을 위한 Mathstra...
Summary오늘의 AI 소식에서는 PyTorch, Microsoft, OpenAI, Amazon, Apple, 그리고 다양한 연구 기관에서 발표된 최신 기술과 연구 결과들을 다룹니다. PyTorch에서는 FlashAttention-3를 발표하며 주목할 만한 성능 향상을 이루었고,...
SummaryOpenAI에서는 Microsoft Azure AI 플랫폼을 Oracle Cloud Infrastructure (OCI)로 확장하는 파트너십을 발표했습니다. META는 모바일 기기에 최적화된 대규모 언어 모델인 MobileLLM을 소개했습니다. Synthesia는 AI...
SummaryKyutai에서는 Moshi라는 실시간 네이티브 멀티모달 모델을 발표하였습니다. Moshi는 감정을 표현하고 이해하며, 음성을 생성하고 들을 수 있는 기능을 갖추고 있습니다. InternLM에서는 IXC-2.5라는 새로운 비전 언어 모델을 공개하였습니다. 이 모델은 고...
서론행사: Config 2024연사: 딜런 필드 (Figma 공동 창립자 및 CEO) 이번 Config 2024에서는 Figma의 최신 업데이트와 혁신적인 기능이 소개되었습니다. 특히 AI 기능에 중점을 두어 작업 효율성을 극대화하고 사용자 경험을 개선하는 데 집중했습니다. 주요 ...
SummaryOpenAI에서는 Critic 모델을 도입하여 AI 코드 평가 신뢰성을 높였습니다. Critic 모델은 인간보다 코드의 오류를 더 잘 잡아내며, 인간 평가자와 협력하여 성과를 극대화합니다. NVIDIA는 AI 클라우드 제공업체를 위한 새로운 참조 아키텍처를 발표하여 A...
SummaryGoogle Research에서는 Gemma 2를 발표하였습니다. Gemma 2는 9B 및 27B 파라미터 크기로 제공되며, 각각 13조 및 8조 토큰으로 훈련되었습니다. 이 모델은 Meta Llama 3 70B와 유사한 성능을 보여줍니다. Meta에서는 Meta LL...
SummaryOpenAI에서는 데이터 인덱싱과 쿼리 기능을 제공하는 실시간 분석 데이터베이스인 Rockset을 인수하여 자사의 검색 인프라를 강화할 예정입니다. Arcee.ai에서는 새로운 Qwen2 7B 기반의 커스텀 모델 Arcee-Spark를 출시하여 AGIEval과 MT-B...
Summary오늘의 AI 뉴스에서는 여러 회사들의 최신 AI 발표와 연구 결과가 소개되었습니다. Anthropic에서는 Claude 3.5 Sonnet 모델을 출시하여 업계 기준을 높였으며, OpenAI의 공동 창립자였던 Ilya Sutskever는 새로운 안전 중심의 AI 연구소...