미술 대회에서 1위를 차지한 AI 아티스트😜

여기서잠깐! 중요한 내용을 알려드려요!

• 인간이 사물을 받아들이는 방식으로 학습하는 '멀티 모달 AI' • AI의 미래를 보여주는 ‘DALL.E • AI로 진화하는 미디어 멀티 모달 AI가 만드는 긍정적 경험 • AI, 창작의 영역에 발을 딛다, 미술 대회에서 1위를 차지한 AI 아티스트 • 'AI 르네상스'의 태동, 발달에 가속 붙은 AI, 새로운 시대는 곧 열릴까

인공지능은 성능이 뛰어난 프로그램 이상의 것입니다. 인공지능은 기계 학습, 딥 러닝, 자연어 처리, 컴퓨터 비전, 강화 학습 등 다양한 분야에서 적용되는 기술을 통해 데이터를 분석하고, 패턴을 파악하며, 문제를 해결하는 능력을 갖추고 있습니다. 이러한 능력은 전통적인 프로그램보다 더욱 정교하고 막강합니다.

AI, 인간의 언어를 이해하다

첫 번째 목표 지점에 도달한 AI

미국의 AI 연구기관 'Open AI'는 일론 머스크를 비롯한 주도자들이 설립한 기관으로, 딥러닝을 활용한 AI 언어 모델을 개발하고 있습니다. 이는 인간이 소통과 기록을 위해 가장 많이 사용하는 수단인 언어를 이해하는 것에 중점을 두고 있습니다.

Open AI의 언어 모델인 'GPT-n' 시리즈는 언어를 분석하고 구사하는 능력이 뛰어나 AI의 기준이 되고 있습니다. 이러한 능력을 바탕으로 Open AI는 다양한 분야에서 인공지능 기술을 활용해 문제를 해결하고자 노력하고 있습니다.

GPT-2

GPT-3

GPT-4

2019년 공개 약 800만 건의 텍스트 데이터를 학습, 키워드를 입력하면 뉴스 기사, 소설, 에세이 등을 한 페이지 분량으로 작성하는 것이 가능

2020년 공개 GPT-3는 전 버전보다 학습 분야가 넓어지고 문장의 이해능력이 비약적으로 상승하여 사용자의 요구에 보다 정확한 답변을 제시

2023년 공개 ‘튜링 테스트’는 AI가 인간과 얼마나 자연스럽게 소통할 수 있는지를 측정하는 기술 테스트, GPT-4는 이를 통과한 최초의 AI가 될 것이라 예상

다음 목표는 고차원적 사고가 가능한 인공지능

인간이 사물을 받아들이는 방식으로 학습하는 '멀티 모달 AI'

멀티 모달 AI는 인간의 사물 인식 방식을 모방하여 학습하는 방식입니다. 이를 위해 멀티 모달리티(Multi Modality)라는 방식을 사용하는데, 이는 시각, 청각 등 다양한 양식의 정보를 AI에게 입력하는 방식을 말합니다.

이렇게 다양한 채널을 통해 입력된 정보를 기반으로 AI는 사물의 형태, 색상, 소리 등을 이해하고 분석하여 사용자의 의도와 목적을 더욱 정확하게 이해하고 대응할 수 있게 됩니다. 이를 통해 멀티 모달로 학습된 AI는 인간처럼 고차원적인 사고 회로를 갖게 되어 인간과 보다 유사한 인식 및 응답 능력을 갖게 됩니다.

AI 언어모델

멀티 모달AI

NEXT AI

텍스트와 자연어 이해가 중점 인간이 일상적으로 사용하는 언어의 분석이 가능해야 질문을 이해하고 반응할 수 있으므로 텍스트와 일상 언어(자연어)를 이해하는 것에 중점

복합적인 정보를 수용하며 ‘관계’를 이해 시각〮청각·동작 등 다양한 양식의 정보를 시스템의 기준에 따라 분류하고 각 속성을 이해, 정보를 설명하는 텍스트 간의 관계를 학습

더욱 높은 차원의 사고가 가능 멀티 모달을 통해 텍스트-이미지-속성 등의 관계를 파악하고 정보를 복합적으로 이해하며 지식 축적, 이는 AI가 상황을 종합적으로 해석할 수 있는 기반

AI의 미래를 보여주는 ‘DALL.E

멀티 모달 학습을 통해 제작의 영역부터 전문 영역까지 섭렵

최근에는 텍스트와 이미지를 모두 활용하여 AI 모델을 학습시키는 멀티 모달 AI 기술이 주목받고 있습니다. 이러한 기술의 대표적인 예로 Open AI에서 공개한 DALL-E 시리즈가 있습니다. DALL-E 2는 사용자가 입력한 텍스트를 이해하고 이에 맞는 이미지를 생성하는데, 이뿐만 아니라 이미지를 효과적으로 편집하는 기능도 지원합니다. 이러한 기술은 미래의 AI 기술 발전 가능성을 보여주며, 이미지 생성 및 편집 분야에서 많은 응용 가능성을 가지고 있습니다.

텍스트 설명을 이해해 이미지를 생성

‘우주에서 말을 탄 우주 비행사’를 ‘사실적인 스타일’로 그려달라는 요청에 따라 달리-2가 제작한 이미지, 개념·속성·스타일 등 여러 요소를 복합적으로 적용 가능

원본 이미지를 새로운 구성으로 확장

붉은 사각형의 원작에 배경 요소를 더해 확장, 원본 이미지의 구성 요소, 분위기, 화풍 등을 분석해 원본 이미지와 연속성 높은 확장이 가능

복합 요소를 고려한 고품질의 편집

편집 요소와 위치 등을 자연어로 지정하면 그림자, 반사, 질감을 고려해 요소를 자연스럽게 추가하거나 제거하는 것이 가능

AI로 진화하는 미디어

멀티 모달 AI가 만드는 긍정적 경험

멀티 모달 AI는 다양한 분야에서 긍정적인 경험을 제공할 수 있습니다. 국내외 빅테크 기업들 역시 멀티 모달 AI를 활용하여 서비스를 고도화하고 있습니다. 예를 들어, 큐레이션과 검색, 서비스 품질 등 사용자가 바로 체감할 수 있는 단계에 적용된 멀티 모달 AI는 뛰어난 사용자 경험을 제공할 수 있습니다.

또한, 만족도 높은 AI 서비스는 미디어 체류 시간 증대와 구매 전환 증대에 긍정적인 영향을 미칠 수 있습니다. 이러한 이유로 멀티 모달 AI는 사용자 경험 및 비즈니스 성과를 향상시키는데 큰 역할을 할 수 있습니다.

[META]

멀티 모달 기반 추천 방식이 적용된 ‘Reels’

AI가 비디오 데이터와 사운드 데이터를 종합적으로 인식, 유사한 움직임을 보이는 비디오와 유사한 음악이 재생되는 비디오를 추천

[GOOGLE]

멀티 모달 AI가 만드는 새로운 쇼핑 경험 ‘멀티 서치’ 제품 사진에 검색어를 추가하면 같은 특성을 가진 다른 제품을 찾아 매칭, 이미지와 검색어를 조합해 원하는 제품을 손쉽게 찾을 수 있는 검색 도구

NAVER]

신규 AI 서비스 ‘멀티 모달 문서검색’ 공개

검색 시 입력한 키워드와 이미지를 분석하여 사용자의 검색 의도를 파악하고, 매칭 적합도가 높은 문서를 분류해 맞춤형 검색 결과로 제공

AI, 창작의 영역에 발을 딛다

미술 대회에서 1위를 차지한 AI 아티스트

콜로라도 주립박람회 미술 대회에서 AI가 그린 디지털 아트가 1위를 차지한 결과에 대해 논란이 있었습니다.

제이슨 M. 앨런(39)이 AI 기술을 활용하여 제작한 작품 '스페이스 오페라 극장'(Theatre D'opera Spatial)이 콜로라도 주립 박람회 미술대회의 디지털아트 부문에서 발표되었습니다.

이 작품은 스페이스 오페라를 주제로 한 3D 시각화 작품으로, 우주의 다양한 장면들을 느껴볼 수 있도록 설계되어 있습니다. 관객들은 VR 기기를 통해 현실감 넘치는 우주 공간을 경험할 수 있으며, 공간에서는 오페라 공연을 관람할 수 있습니다.

제이슨 M. 앨런은 게임 기획자 출신으로, 이번 작품에서는 AI 기술을 사용하여 다양한 우주 장면들을 생성하였습니다. 이를 위해 제이슨은 AI 모델을 학습시켜 우주 장면을 생성하는 알고리즘을 개발하였으며, 이를 통해 고품질의 3D 시각화 작품을 제작할 수 있었습니다.

AI를 활용한 디지털 아트 작품은 미술계에서 점점 더 주목받고 있으며, 기술의 발전으로 더욱 창의적이고 혁신적인 작품들이 탄생할 것으로 예상됩니다. 이번 작품을 통해 제이슨 M. 앨런은 게임 기획자로서의 역량뿐만 아니라 AI를 활용한 창의적인 작품 제작 능력을 인정받았습니다.

이 작품이 입력된 명령어에 따라 만들어진 이미지를 예술로 인정할 수 있는지에 대한 쟁점이 있었지만, 이번 사건에서 우리가 정말 주목해야 할 것은 AI의 능력이 어디까지 발전하였는가이며, 이제 인간의 창작 영역에 발을 디뎌 더 나은 성과를 보이고 있다는 점입니다.

AI는 이제 인간 고유의 영역으로 여겨졌던 창작의 분야에도 도전하고 있으며, 때로는 인간보다 더 인간적이고 뛰어난 능력을 보이기도 합니다. 이번 사례는 인간과 AI의 창작 활동의 경계가 점점 모호해지고 있음을 보여주며, 앞으로 더 많은 분야에서 인간과 AI가 협력하여 창조적인 성과를 이루어낼 것으로 기대됩니다.

'콜로라도 주립 박람회 미술대회'의 디지털아트 부문에서 게임 기획자인 제이슨 M. 앨런(39)이 AI로 제작한 작품'스페이스 오페라 극장'(Theatre D'opera Spatial)

'AI 르네상스'의 태동

발달에 가속 붙은 AI, 새로운 시대는 곧 열릴까

10년 전에는 이미지 분류도 어려웠던 AI가 이제는 자유자재로 이미지를 생성하고 분류하는 등의 기술을 보유하고 있습니다.

AI의 발달 속도는 가속되고 있으며, 미래에는 우리가 상상하는 것 이상의 발전이 이루어질 것으로 예상됩니다. 이러한 AI의 발전은 새로운 르네상스 시대를 열 것이며, 다양한 분야에서 비약적인 발전을 이끌어낼 것으로 기대됩니다.

3세대 언어모델 "GPT-3'

여러 장르에서 수준 높은 작문과 대화, 언어와 관련된 문제 풀이와 번역, 프로그래밍 언어를 이용한 코딩 등이 가능

이미지 생성 모델 ‘DALL.E-1’

동이 트는 들판에 앉아있는 여우의 모습, 모네의 화풍으로 작화

[이미지 생성 모델 ‘DALL.E-2’

달리-1보다 더욱 사실적이고 정확한 이미지를 생성

4세대 언어 모델 ‘GPT-4’

최종 형태에 가까운 언어 모델이 될 것으로 예상, 더욱 향상된 언어 이해력과 구사력으로 사람과 구분되지 않는 수준의 대화가 가능할 것

언어 모델과 멀티 모달의 결합 ‘New Generation AI’

전문적인 언어 능력과 복합적인 학습으로 고차원적인 사고와 추론이 가능한 AI, 다양한 분야에서 기술적 발전을 리드

바쁜 구독자님을 위한 여섯 줄 요약

인공지능(AI)의 첫 번째 목표인 인간의 언어 이해를 달성하는 기술이 개발되었다. 이제는 인간이 사물을 받아들이는 방식으로 학습하는 '멀티 모달 AI' 기술에 더욱 초점을 맞추고 있다. 이 기술은 고차원적인 사고를 가능하게 하는 인공지능 기술을 발전시키는 중요한 역할을 한다. 'DALL-E'라는 인공지능 기술은 멀티 모달 학습을 통해 제작의 영역부터 전문 영역까지 놀라운 작품을 만들어냈다. 이 기술은 AI의 미래를 보여준다고 할 수 있다. 인공지능 기술이 더욱 발전하면서 미디어 분야에서도 많은 일이 일어나고 있다. 멀티 모달 AI 기술을 이용한 작업은 매우 흥미롭고 긍정적인 결과를 만들어낸다. 인공지능이 창작의 영역에서도 발전하고 있다. 최근에는 미술 대회에서 AI 아티스트가 1위를 차지하는 등 인공지능이 창작의 영역에서도 주목받고 있다. 인공지능 기술이 발전하면서 'AI 르네상스'의 태동이 일어나고 있다. 이러한 발전은 새로운 시대를 열어갈 것으로 기대된다.