마이크로 소프트가 2023년 3월 11일 mixed reality 스펙트럼연구로 가상공간과 현실 공간을 연결하기 위해 i-code, kosmos 모델을 이용한 visual chatgpt 를 출시합니다.
GPT4 출시
Andreas Braun, Microsoft 독일 CTO는 ‘우리는 다음 주에 GPT-4를 소개할 것입니다. 거기서 우리는 비디오와 같이 완전히 다른 가능성을 제공할 멀티모달 모델을 갖게 될 것이다. LLM은 기계가 자연어를 이해하도록 가르치기 때문에 이전에는 인간만 읽고 이해할 수 있었던 것을 통계적 방식으로 이해합니다. 그동안 기술은 기본적으로 “모든 언어로 작동”할 정도로 발전했습니다. 독일어로 질문하고 이탈리아어로 답을 얻을 수 있습니다. 다중 양식을 통해 Microsoft(-OpenAI)는 “모델을 포괄적으로 만들 것”입니다.’라고 발표했다.
마이크로소프트 코즈모스 출시
마이크로 소프트는 kosmos1 이라는 멀티모달 라지 랭귀지 모델을 출시했다. 코스모스는 단순한 텍스트 인공지능 모델이 아닌, 시각, 청각 모델리티 이다.
MLLM (Multimodal masive Languge Model) KOSMOS
Microsoft Introduces Kosmos-1: A Multimodal Large Language Model That Can Perceive General Modalities, Follow Instructions, And Perform In-Context Learning
A general-purpose interface for various natural language activities has been successfully implemented using large language models (LLMs) by a team of Microsoft researchers. An LLM-based interface may be customized for a task as long as the input and output can be converted into text. For instance, a…
i-Code (아이 코드)란?
인간의 지능은 복합적입니다. 시각적, 언어적, 청각적 신호를 통합하여 전체적인 세계관을 유지합니다. 그러나 현재 대부분의 사전 훈련 방법은 하나 또는 두 가지 양식으로 제한됩니다. 우리는 사용자가 시각, 음성 및 언어 양식을 통합 및 범용 벡터 표현으로 유연하게 결합할 수 있는 자체 감독 사전 훈련 프레임워크인 i-Code를 제시합니다.
GPT-4 is coming next week – and it will be multimodal, says Microsoft Germany
The release of GPT-4 is imminent, as Microsoft Germany CTO Andreas Braun mentioned at an AI kickoff event on 9 March 2023.
Visual-ChatGPT 출시
마이크로소트에서 GPT4 기반의 비쥬얼 쳇지피티를 다음주 출시합니다.이는 단순한 문자 텍스트 기반이 아닌, 시각적(사진), 청각적(오디오)가 통합된 인공지능 모델이다.
GitHub – microsoft/visual-chatgpt: VisualChatGPT
VisualChatGPT. Contribute to microsoft/visual-chatgpt development by creating an account on GitHub.