Cohere에서는 새로운 모델 C4AI Command R+ 08-2024를 발표하여 멀티스텝 도구 사용과 다국어 지원을 포함한 고급 기능을 제공합니다. Qwen에서는 Qwen2-VL을 출시하여 복잡한 이미지 및 비디오 이해, 다국어 지원, 그리고 실시간 대화 기능을 강화했습니다. Salesforce는 대규모 행동 모델인 xLAM 시리즈를 공개하며, NVIDIA는 NV-Embed-v2로 MTEB 리더보드 1위를 탈환했습니다. 여러 연구 논문이 대형 언어 모델의 평가 방법과 성능에 대한 중요한 기술적 인사이트를 제공했으며, Gartner는 판매 혁신을 이끌 주요 기술들을 분석하여 발표했습니다.
Cohere, Model Card for C4AI Command R+ 08-2024
링크, 8/30/24
- C4AI Command R+ 08-2024는 1040억 개의 파라미터를 갖춘 대형 언어 모델로, Retrieval Augmented Generation(RAG)과 다단계 도구 사용을 지원하여 복잡한 작업을 자동화하는 데 최적화됨.
- 이 모델은 Grouped Query Attention(GQA) 방식을 사용하여 최대 2배 높은 처리량과 낮은 지연 시간을 제공함.
- 23개 언어로 학습되고, 한국어를 포함한 10개 언어로 평가되어 다양한 다국어 환경에서 활용 가능.
- 최대 128K 길이의 컨텍스트를 지원하여 장문의 텍스트 처리에서도 높은 성능을 유지함.
- 모델은 Transformer 라이브러리와 호환되어 손쉽게 사용 가능하며, 허깅 페이스 허브에서 모델 체크포인트를 제공함.
Qwen, Qwen2-VL: To See the World More Clearly
링크, 8/29/24
- Qwen2-VL은 비전 언어 모델 Qwen2를 기반으로 한 최신 버전으로, 다양한 해상도와 비율의 이미지를 효과적으로 처리할 수 있는 SoTA(State-of-the-Art) 성능을 자랑.
- 비디오 이해 기능이 대폭 향상되어 최대 20분 이상의 비디오를 분석, 질문에 답하거나 실시간 대화를 유지할 수 있음.
- Qwen2-VL은 Naive Dynamic Resolution 지원을 통해 다양한 해상도의 이미지를 동적으로 처리하며, Multimodal Rotary Position Embedding(M-ROPE) 기법을 도입하여 1D 텍스트, 2D 이미지, 3D 비디오 정보의 위치 정보를 동시에 캡처하고 통합함.
- 7B 모델은 비용 효율성을 유지하면서도 이미지, 다중 이미지, 비디오 입력을 지원하여 다양한 작업에서 우수한 성능을 발휘함.
- 작은 크기의 2B 모델도 출시되어 모바일 배포를 염두에 두고 최적화되었으며, 비디오 관련 작업과 문서 이해, 일반적인 시나리오 질문 응답에서 우수한 성능을 보임.
Salesforce, Large Action Models xLAM-7B
링크, 8/29/24
- Salesforce의 xLAM 시리즈는 AI 에이전트의 의사 결정과 사용자 의도를 실행 가능한 행동으로 변환하는 대규모 행동 모델로, 7B, 8x7B, 8x22B 등 다양한 파라미터 크기로 제공됨.
- 이 모델들은 사용자의 복잡한 요구를 충족시키기 위해 자율적으로 계획하고 작업을 실행할 수 있는 능력을 갖춤.
- 최대 64K의 컨텍스트 길이를 지원하여 장문의 대화나 복잡한 작업에서도 높은 성능을 유지.
- 이 모델은 Transformers 라이브러리와 통합되어 AI 에이전트 구축에 용이하게 사용 가능.
NVIDIA, NV-Embed-v2
링크, 9/1/24
- NV-Embed-v2는 Massive Text Embedding Benchmark(MTEB)에서 72.31점이라는 기록적인 점수를 달성하며 56개의 텍스트 임베딩/검색 작업에서 1위를 차지.
- 모델은 Latent-Attention Pooling 기법을 사용하여 임베딩 출력을 개선하고, 하드 네거티브 마이닝을 통해 잘못된 네거티브 샘플을 제거하여 성능을 향상시킴.
- NV-Embed-v2는 Mistral-7B-v0.1 기반의 디코더-온리 LLM을 사용하여 4096 차원의 임베딩을 생성하며, 특히 RAG 기술 개발에 필수적인 검색 작업에서 탁월한 성과를 보임.
Gartner, Gartner Hype Cycle Reveals Top Technologies That Will Transform Sales In the Next Decade
링크, 8/28/24
- Gartner는 2024년 판매 기술 하이프 사이클을 통해 향후 10년간 판매를 혁신할 25가지의 주요 기술을 발표, 이들 기술은 자율형 AI, 개발자 생산성 향상, 총체적 경험, 인간 중심의 보안 및 개인정보 보호 등 네 가지 트렌드로 분류됨.
- 자율형 AI:
- AI 시스템이 인간의 감독 없이 스스로 학습하고 복잡한 환경에서 효과적으로 의사 결정을 내릴 수 있도록 개발 가속화.
- 이 기술에는 다중 에이전트 시스템, 대규모 행동 모델, 자율 에이전트 등이 포함됨.
- 개발자 생산성 향상:
- AI 증강 소프트웨어 엔지니어링, 클라우드 네이티브, 프롬프트 엔지니어링 등의 기술이 개발자의 생산성을 극대화함.
- 총체적 경험:
- 고객 경험, 직원 경험 등을 통합하여 우수한 공유 경험을 창출하고, 이를 통해 신뢰도, 만족도, 충성도를 향상.
- 인간 중심의 보안 및 개인정보 보호:
- AI 트리즘, 디지털 면역 시스템 등 신뢰 기반의 보안 기술을 통해 조직의 보안 구조를 강화하고, 프라이버시 문제를 해결할 수 있는 방안을 제시.
- Emotion AI:
- 감정 AI는 사용자의 감정 상태를 분석하여, 판매 팀이 고객과 더 깊이 공감할 수 있도록 도와줌.
- 이 기술은 프라이버시 및 윤리적 문제 해결이 필요한 과제를 포함.
- Digital Twin of a Customer (DToC):
- 고객의 행동을 시뮬레이션하고 예측할 수 있는 가상 모델로, 맞춤형 서비스 제공 및 고객 경험 개선을 지원.
- 이러한 기술 도입을 위해서는 고도의 머신러닝 알고리즘과 데이터 과학 인력이 필요.
- Machine Sellers:
- 비인간 에이전트가 판매를 자동화하여 효율성을 크게 증가시키며, 특히 반복적인 수익 창출 모델에서 강력한 효과를 발휘.
- 산업별, 지역별, 비즈니스 모델별로 도입 효과 차이가 있을 것으로 예상.
연구 논문, Let Me Speak Freely? A Study on the Impact of Format Restrictions on Performance of Large Language Models
링크, 8/5/24
- 연구는 대형 언어 모델(LLM)에서 구조화된 형식(JSON, XML 등)으로 출력할 때 성능 저하를 초래할 수 있음을 확인.
- 형식 제한은 특히 추론 능력에 부정적인 영향을 미치며, 형식 제약이 클수록 성능 저하가 두드러짐.
- Gemini 1.5 Flash 모델이 형식 간 일관성에서 가장 우수한 성능을 보임.
- 연구는 다양한 데이터셋(GSM8K, Last Letter, DDXPlus 등)을 사용하여 분석 수행.
연구 논문, Aligning with Human Judgement: The Role of Pairwise Preference in Large Language Model Evaluators
링크, 3/26/24
- Pairwise-preference Search(PairS) 방법을 도입하여 LLM 평가에서 인간 판단과의 정렬 문제를 해결하고, 평가의 정확성과 일관성을 크게 향상시킴.
- PairS는 여러 텍스트 간 쌍별 비교를 통해 평가 대상을 순위화하는 방법으로, 기존의 Win-loss 비율이나 ELO 레이팅 시스템보다 효율적이며, 약 30%의 비교만으로 유사한 성능을 달성 가능.
- 연구는 Spearman 상관계수에서 G-Eval, Win-loss rate, ELO rating보다 높은 성
능을 기록하며, 코드와 예제를 공개하여 연구 재현성을 보장.
Sources
This GPT assists users by creating a detailed daily newspaper in Korean based on provided links. It follows these steps: read the content, summarize each content with detailed points, and write a report. The report format is:
(today’s date in 년 월 일) AI 소식,
Summary
(overall short summary, make summary with good details. for Summary section, explain the details starting with company name, e.g. OpenAI에서는 ~~~를 발표하였습니다.)
company name, Title
링크, date
- detailed summary1, (개조식 문체 사용)
- detailed summary2, (개조식 문체 사용)
… - detailed summary N, (개조식 문체 사용)
company name, Title
링크, date
링크, date,
- detailed summary1, (개조식 문체 사용)
- detailed summary2, (개조식 문체 사용)
… - detailed summary N, (개조식 문체 사용)
…
1 | ### |