visual chatgpt 2023년 3월 출시

마이크로 소프트가 2023년 3월 11일 mixed reality 스펙트럼연구로 가상공간과 현실 공간을 연결하기 위해 i-code, kosmos 모델을 이용한 visual chatgpt 를 출시합니다.

GPT4 출시

Andreas Braun, Microsoft 독일 CTO는 ‘우리는 다음 주에 GPT-4를 소개할 것입니다. 거기서 우리는 비디오와 같이 완전히 다른 가능성을 제공할 멀티모달 모델을 갖게 될 것이다. LLM은 기계가 자연어를 이해하도록 가르치기 때문에 이전에는 인간만 읽고 이해할 수 있었던 것을 통계적 방식으로 이해합니다. 그동안 기술은 기본적으로 “모든 언어로 작동”할 정도로 발전했습니다. 독일어로 질문하고 이탈리아어로 답을 얻을 수 있습니다. 다중 양식을 통해 Microsoft(-OpenAI)는 “모델을 포괄적으로 만들 것”입니다.’라고 발표했다.

https://www.microsoft.com/en-us/research/publication/i-code-an-integrative-and-composable-multimodal-learning-framework/

마이크로소프트 코즈모스 출시

마이크로 소프트는 kosmos1 이라는 멀티모달 라지 랭귀지 모델을 출시했다. 코스모스는 단순한 텍스트 인공지능 모델이 아닌, 시각, 청각 모델리티 이다.

MLLM (Multimodal masive Languge Model) KOSMOS

i-Code (아이 코드)란?

인간의 지능은 복합적입니다. 시각적, 언어적, 청각적 신호를 통합하여 전체적인 세계관을 유지합니다. 그러나 현재 대부분의 사전 훈련 방법은 하나 또는 두 가지 양식으로 제한됩니다. 우리는 사용자가 시각, 음성 및 언어 양식을 통합 및 범용 벡터 표현으로 유연하게 결합할 수 있는 자체 감독 사전 훈련 프레임워크인 i-Code를 제시합니다. 

Visual-ChatGPT 출시

마이크로소트에서 GPT4 기반의 비쥬얼 쳇지피티를 다음주 출시합니다.이는 단순한 문자 텍스트 기반이 아닌, 시각적(사진), 청각적(오디오)가 통합된 인공지능 모델이다.