DeepseekAI는 코딩 작업에 최적화된 모델 DeepSeek v2.5를 출시하여 GPT-4o를 능가하는 성능을 보여주었고, Matt Shumer는 Reflection-Llama 3.1 70B 모델을 공개해 자체 학습과 오류 교정 기술로 뛰어난 성능을 자랑했습니다. IBM은 Po...
Cohere에서는 새로운 모델 C4AI Command R+ 08-2024를 발표하여 멀티스텝 도구 사용과 다국어 지원을 포함한 고급 기능을 제공합니다. Qwen에서는 Qwen2-VL을 출시하여 복잡한 이미지 및 비디오 이해, 다국어 지원, 그리고 실시간 대화 기능을 강화했습니다. ...
NAVER에서는 HyperCLOVA X Vision을 발표하며, 텍스트와 이미지 처리가 가능한 대규모 비전-언어 모델을 소개하였습니다. 또한, 오토브라우징 기술을 통해 LLM의 실시간 정보 수집과 처리 능력을 강화하는 방법도 제시하였습니다. Google은 세 가지 새로운 Gemin...
Nvidia는 고성능 소형 언어 모델인 Mistral-NeMo-Minitron 8B를, AI21 Labs는 긴 문맥 처리에 특화된 Jamba 1.5 모델을 선보였습니다. 또한, Jina AI는 장문 임베딩 모델의 새로운 처리 방법을 소개하였으며, Meta는 인간 중심 비전 작업을 ...
OpenAI에서는 GPT-4o 모델의 세부 조정 기능을 출시하여, RAG(최신 정보 검색) 기반 모델보다 더 높은 성능과 효율성을 제공하는 점을 강조했습니다. Microsoft는 Phi-3.5 MoE 모델을 발표하며, 이 모델이 RAG보다 강력한 추론 성능을 발휘하는 점을 부각했습...
오늘의 소식에서는 xAI, OpenAI, Google, Anthropic, Intel, TII, Alibaba, Meta, AmorePacific, LG전자, 그리고 Gartner의 AI와 관련된 주요 발표와 업데이트가 포함되어 있습니다. 각각의 회사는 다양한 분야에서 AI 기술을...
OpenAI에서는 GPT-4o 모델에 대한 시스템 카드를 발표하며, 모델의 안전성 평가 및 잠재적 리스크 관리에 대해 설명하였습니다. 또한, Zico Kolter가 이사회의 새로운 구성원으로 합류하였으며, ChatGPT 무료 사용자들을 위한 DALL·E 3 이미지 생성 기능이 출시...
LG AI Research는 EXAONE 3.0을 공개하며, OpenAI는 Structured Outputs 기능을 도입하였습니다. Meta는 Self-Taught Evaluators 접근법을 소개하며, Hugging Face는 Idefics3-8B를 출시했습니다. Black Fo...
Apple은 Apple Intelligence Foundation 모델에 대한 상세 보고서를 공개했습니다. Google은 Gemma 2 2B 모델을 소개하였으며 GPT-3.5 모델보다 뛰어난 성능을 보였습니다. Meta는 Segment Anything Model 2 (SAM 2)를...
OpenAI에서는 SearchGPT 프로토타입을 출시하여 사용자가 웹에서 빠르고 신뢰할 수 있는 답변을 쉽게 찾을 수 있도록 하였습니다. 이 프로토타입은 소수의 사용자 및 출판사 그룹에게 제공되어 피드백을 수집하고 있습니다. 또한, Rule-Based Rewards(RBR)을 이용...