"인공지능 산업은 계속 성장할 수 밖에 없는 산업입니다."
"산업에 대해 공부하고, 관련 기업들에 대한 정보를 알아두는 것은 투자의 기초이자 핵심입니다. "
인공지능 대표 관련주 : 아마존, 구글(알파벳), 테슬라, 네이버, 현대차, 로보스타
목 차 |
1. 인공지능의 핵심기술 1) GPT-3 2) 연합학습(Federated Learning) 3) 엣지 AI 4) 트랜스포머(Transformer) 5) 시스템2 AI 6) 자기지도학습(Self Supervised Learning) 7) 생성적 AI(Generative AI) 8) 전이학습(Transfer Learning) 9) 자동기계학습(Auto Machine Learning) 2. 실제 인공지능의 활용사례와 관련 기업 |
인공지능 기술에 대한 정의와 관련 기술분야 종류에 대해 지난 포스팅에서 다뤘습니다. 지난 포스팅 내용은 하단의 링크에서 확인해 주시면 됩니다. 그리고 끝까지 보시면 인공지능 기술에 관련된 모든 기업들을 확인하실 수 있습니다.
인공지능의 핵심기술
인공지능 기술은 사회 전반에 걸쳐 혁신을 만들어 줄 것이라는 기대에 비해 아직 구현 기능은 많은 한계를 보여주고 있습니다. 또한 이런 한계를 극복하기 위해 전 세계적으로 다양한 연구들이 동시에 이루어지고 있는 상황입니다.
1) GPT-3
* Generative Pre-trained Transformer 3
GPT3는 딥러닝을 이용해 인간 다운 텍스트를 만들어내는 자기회귀 언어 모델이라고 합니다. OpenAI사가 만들었으며 여러가지 언어 관련 문제풀이, 랜덤 글짓기, 간단한 사칙연산, 번역, 주어진 문장에 따른 간단한 웹 코딩, 대화 등이 가능하다고 알려져 있습니다.
처리가능한 매개변수가 1,750억 개로 2020년 2월에 발표한 MS사의 Turing LNG보다 처리용량이 10배 정도 큽니다. 책이나 인터넷에 있는 수많은 텍스트 학습을 통해 새로운 텍스트를 생성할 수 있으며, 실제로 GPT3가 생산한 텍스트는 사람이 작성한 텍스트와 구별이 어려웠다고 합니다.
GPT3와 같은 대형언어모델은 다양한 분야에서 활용이 가능합니다. 사람과 대화하는 것처럼 느낄 수 있는 챗봇을 만들고, 뉴스를 자동으로 생산하고, AI가 만드는 시나리오를 통해 어드벤처 게임을 만들기까지 무궁무진한 활용 가능성을 가지고 있습니다.
2) 연합학습(Federated Learning)
연합학습은 AI 모델 학습 시 데이터를 통합하고 이동하면서 발생할 수 있는 개인정보보호 이슈의 부담을 완하하기 위해 만들어졌습니다. 2016년 Google에서 연합학습을 발표한 이후 관련 연구가 폭발적으로 증가했으며, 글로벌 기업들도 연합학습에 대한 연구개발에 참여하고 있습니다.
구글은 연합학습을 'Collaborative Machine Learning without Centralized Training Data'로 정의합니다. 이전까지는 인공지능 학습하기 위해서는 모든 데이터를 중앙 서버에 모아 학습을 시켰습니다. 하지만 연합학습은 중앙 서버가 아닌 개별 스마트폰에서 학습을 시키는 개념입니다.
여러분야에서 연합학습을 적용하려는 시도가 있습니다. 그 중에서도 가장 활발한 분야는 의료 영역입니다. 의료기관은 개인의료정보 활용에 대한 법적 규제로 인공지능 활용이 제한적이었습니다. 환자들의 데이터 또한 여러 병원에 분산되서 저장되어 있고, 개인 사생활 문제와 법적 규제로 인해 데이터 공유나 병원 간 협업이 자유롭지 않았습니다. 하지만 연합학습은 여러 병원에 분산되어 있는 데이터를 공유하지 않고도 모든 데이터를 한 곳으로 모아 분석한 것과 같은 효과를 가질 수 있습니다.
3) 엣지 AI (Edge AI)
엣지 AI는 물리적 세계 전반에 걸쳐 기기에 AI 애플리케이션을 구축하는 것을 의미합니다. "엣지"라는 단어가 붙는 이유는 AI 연산이 클라우드 컴퓨팅 설비나 사설 데이터센터 중심에서 이뤄지는 것이 아니라 데이터가 위치한 곳에 근접한 네티워크의 가장자리(엣지) 사용자 주변에서 이뤄지기 때문입니다. (출처: NVIDIA)
엣지 AI의 일반적인 예시로 Google Assistant, Apple Siri, Amazon Alexa와 같은 가상 지원 서비스를 들 수 있습니다. 엣지 AI는 데이터를 데이터 센터나 클라우드로 보내 처리하는 중앙집중형 방식에 비해 대기 시간이 짧고 더 빠르게 로컬에서 처리하는 것을 지원할 수 있습니다. 데이터 전송에 대한 제약도 적고, 빠른 응답 시간으로 속도가 중요한 모바일이나 웨어러블 Device에서 UX가 향상됩니다. 그로 인해 소비자의 선호도와 만족도를 증가시키게 됩니다.
그리고 기업입장에서는 많은 양의 데이터를 스트리밍 할 필요가 없어 통신 비용을 절감시킬 수 있으며, 로컬에서 기계학습이 이루어지기 때문에 중앙에서 엔지니어가 지속적으로 모니터링 할 필요가 없습니다. 보안적인 측면에서도 데이터를 중앙서버가 아닌 로컬에서 처리와 저장이 일어나기 때문에 매우 우수합니다.
엣지 AI는 AI 알고리즘을 사용하여 데이터를 처리하고, 특정 요인을 바탕으로 응답을 생성하는 표준 Machine Learning Architecture 원리를 바탕으로 하고 있습니다. 과거에는 중앙 집중식 데이터 센터로 데이터를 전송하고, 분석하였으나 스마트 기기의 보급화와 IoT로 인해 데이터 분석이 가능한 장소가 분산되었습니다. 엔드포인트 장치에 필수 알고리즘이 포함된 마이크로 프로세서가 내장되어 있어 의도한 프로그래밍을 바탕으로 데이터의 종류와 상관없이 실시간으로 정보를 수집하고 해석하여 결정을 내릴 수 있습니다.
4) 트랜스포머(Transformer)
트랜스포머는 언어처리의 병렬화를 통해 계산 효율성 향상 등 그간 순차적으로 단어를 학습하는 알고리즘의 한계를 극본한 기술입니다. 2017년 Google에 의해 트랜스포머가 등장하기 전에는 데이터를 단어의 순서대로 처리하는 순환신경망(Recurrent Neural Network, RNN) 방식을 활용하여 언어처리를 했습니다. 하지만 트랜스포머로 인해 대규모 데이터셋을 학습할 수 있게 되었고, 그 결과 GPT-3와 같이 대규모 용량의 훈련이 가능해진 것입니다.
트랜스포머는 단어 입력을 순차적으로 받는 방식이 아니므로 단어의 위치 정보를 다른 방식으로 알려주게 됩니다. 단어의 위치 정보를 얻기 위해서 각 단어의 임베딩 벡터에 위치 정보들을 더하여 모델의 입력으로 사용하는데, 이를 포지셔널 인코딩이라고 합니다. 위의 그림은 이런 방식을 간단하게 보여주는 그림입니다.
트랜스포머 등장 전에는 데이터 라벨링을 통해 데이터 세트를 만들고 신경망을 훈련해야 했습니다. 참고로 이런 데이터 세트를 만들기 위해서는 구축에 많은 자원이 소모됩니다. 기업의 입장에서는 부담이 되는 것입니다. 트랜스포머는 요소들 사이의 패턴을 수학적으로 찾아내기 때문에 이러한 과정이 필요없어졌으며, 정말 많은 양의 이미지나 텍스트 데이터를 웹과 데이터베이스를 통해 얻을 수 있게 됩니다. 병렬 프로세싱으로 모델의 실행 또한 빨라지게 됩니다.
5) 시스템2 AI
인공지능이 단순 인식이 가능한 '시스템1' 수준에서 인과관계 파악이 가능한 '시스템2' 수준으로 이동을 위한 연구가 진행중입니다.
시스템 1 | 주변 인식, 직감적 위험 회피 등과 같이 인간이 무의식적으로 처리 가능한 과정으로 뇌의 빠르고 자동적인 접근 방식 |
시스템 2 | 추상적인 문제를 다루거나 새로운 상황을 처리하기 위한 추론이 필요할 때 주로 사용되는 분석적인 과정 |
딥러닝의 창시자이자 인공지능 연구계의 거장인 Joshua Benjio 캐나다 몬트리올대 교수는 인공지능이 학습되지 않은 상황에서도 맥락을 이해하는 '시스템2' 중요성을 강조하면서 인과관계에 대한 추론 영역의 성능 향상 없이는 인간 지능 수준의 인공지능은 확보하기 어렵다고 이야기했습니다.
사람은 대화를 하면서 끊임없이 맥락을 이해하고 추론하고 있습니다. 그렇기 때문에 새로운 정보를 얻으면서 끊임없이 대화하고 토론할 수 있는 것입니다. 시스템2는 바로 이 추론기능을 의미하고 인공지능이 더욱 발전하기 위해서는 시스템2의 향상이 이루어져야 한다고 보는 것입니다.
6) 자기지도학습(Self Supervised Learning)
지도학습은 지난 10년 동안 자율주행, 음성 비서 등 인공지능 분야에서 많은 발전을 주도했지만, 심각한 한계 또한 존재합니다. 데이터 라벨링은 번거롭고 많은 비용을 발생히키고 있어 인공지능 개발의 주요 한계로 작용하고 있습니다. 또한 지도학습은 인공지능이 데이터셋에 포함된 정보, 관계, 의미를 탐색하는 대신 연구자들이 미리 주입한 개념과 범주에만 의존한다는 한계를 가지고 있습니다.
그래서 자기지도학습이라는 개념이 나오게 되었으며, 실제 BERT, GPT-3는 자기지도학습을 활용하여 모델을 생성한 것입니다. 쉽게 이야기하면 선생님이 주입식으로 교육을 하게 되는 것이 지도학습(Supervised Learning)이 되고, 선생님 없이 인공지능에 태깅없는 자료를 주고 스스로 여러가지 자료를 학습하면서 그 자료에 대한 분석을 하는 것이 Unsupervised Learning, 즉 자기지도학습이 되는 것입니다.
자기지도학습은 먼저 GPT-3나 BERT와 같은 대규모 데이트로 특징점을 학습한 후, 전이학습을 통해 목적에 부합하는 성능을 만들어 냅니다. 아직 기술적 수준은 50%로 만족할만한 결과가 나온 것은 아니지만, 자기지도학습이 인공지능 학습방법의 메인스트림이 된다면 NVIDIA와 같은 하드웨어 회사에는 매우 호재가 될 만한 내용일 수 있습니다.
7) 생성적 AI(Generative AI)
생성적 AI는 사물이나 이미지, 텍스트를 인식만 하는 것이 아니라 창조를 하는 AI입니다. 기존의 텍스트, 이미지 등 사람이 창작한 컨텐츠를 학습하여 자체적으로 새로운 컨텐츠를 만들어 내는 것입니다. 생성적 AI의 핵심 원리는 생성적 적대 신경망(Generative Adversarial Network, GAN)입니다. 2014년 Ian Goodfellow의 논문을 통해 처음 발표되었는데, 상대적으로 규모가 작은 데이터세트에서 좋은 성능을 발휘하며 한 번의 네크워크 연산만으로 데이터 생성이 가능해서 높은 효율을 가집니다. 하지만 그와 동시에 대규모 학습이 힘들고 학습이 불안정하다는 단점을 가지고 있습니다.
- 생성적 적대 신경망(Generative Adversarial Network)이란?
입력하는 데이터에 대한 대립하는 데이터를 만들어내고(생성자, Generator), 이렇게 만들어진 것을 평가함(구분자, Discriminator)으로서 이 두개가 서로 대립하고 서로의 성능을 점차 개선해 나가는 원리를 가진 신경망입니다. 많은 사람들이 GAN에 대해 쉬운 예시로 지표위조범(Generator)은 경찰을 속이기 위해 더 발전된 위조 기술을 사용하고 경찰(Discriminator)은 위조된 지표와 위조범을 잡기 위해 감별에 대한 기술을 향상시키고 있다는 것을 활용하여 설명하곤 합니다. |
그래서 Generator와 Discrimicator가 점점 기술이 향상되는 것처럼 GAN도 같은 개념으로 성능을 개선해 나간다고 보면 될 것 같습니다. 이런 과정을 통해 궁긍적인 목표는 구분자가 실제 데이터와 가짜 데이터를 구분하지 못하도록 하는 것이라고 합니다. 한마디로 진짜와 가짜를 구분하지 못할 정도로 정교한 데이터를 만들어내야 한다는 것입니다.
8) 전이학습(Transfer Learning)
딥러닝 분야에서 '이미지 분류' 문제를 해결하기 위해 사용했던 네트워크를 다른 데이터셋 혹은 다룬 문제에 적용시켜 문제를 해결하는 것을 의미하는 기술로서, 일반적인 정의로는 한 분야의 문제를 해결하기 위해 얻은 지식과 정보를 다른 문제를 해결하는 데 사용하는 방식' 입니다.
이 방식을 통해 누구다 딥러닝을 할 수 있는 환경이 확산될 수 있으며 특히나 기업에서 인공지능 모델 개발 시 데이터의 부족, 컴퓨팅 자원 부족 등의 한계를 극복할 수 있도록 지원하는 응용 기술이라고 할 수 있습니다. 이 때 인공지능 모델에 대한 가중치를 미세하게 조절하기 위해 미세조정(Fine Tuning)을 실시합니다.
전통적인 머신러닝 학습은 분리되어 있으며 순수하게 특정 작접, 데이터셋 및 이에 대한 별도의 분리된 모델 훈련에 기초하고 있습니다. 하지만 전이학습의 경우에는 다른 모델이 학습한 내용을 미세조정을 통해 추가적인 데이터셋을 통해 학습한 후 활용할 수 있습니다.
이런 방식은 기업이 중앙집중화된 데이터 센터를 통해 인공지능 모델을 학습시킨 후 대외적으로 제공하면, 제공받은 기업에서는 주변 환경과 추가적으로 필요한 데이터셋만 학습시킨 후 활용이 가능하기 때문에 시간과 자본의 절약이 가능하다는 점에서 매우 유용한 방식입니다. 대규모 학습모델인 BERT와 GPT-3 방식과 연계할 수 있는 매우 중요한 기술이며, 인공지능의 다른 핵심기술과 연계가 되므로 빼놓을 수 없는 기술입니다.
9) 자동기계학습(Auto Machine Learning)
최근에는 머신러닝(ML) 개발 과정에서 소모적이고 반복되는 작업을 자동화하기 위한 프로세스인 자동기계학습(Automated Machine Learning)이 지속적으로 주목받고 있습니다. 현재 인공지능의 개발을 위해서는 [데이터 수집] → [점검 및 탐색] → [전처리] → [모델링 및 훈련] → [평가] → [배포] 라는 과정을 거치고 있어 많은 자원과 시간이 필요합니다.
AutoML은 모델의 성능 최적화 관점에서 데이터의 특징을 추출, 최적의 알고리즘 Architecture 구성, 초매개변수 설정 등의 특징으로 구성되어 있습니다. 숙련된 데이터 연구자가 수행하는 영역을 대신 수행해줌으로서 인력 부족에 대한 해결책으로 부상하고 있습니다. 3대 클라우드 플랫폼에서도 AutoML 솔루션을 제공하는 등 기업의 수요도 빠르게 증가할 것으로 예상되고 있습니다. AutoML은 최적의 알고리즘 선정 등을 통해 모델의 성능을 향상시킬 수 있고, 효율적인 머신러닝 모델이 구축 가능하여 기업의 입장에서는 매우 효율적인 사용이 가능하기 때문입니다.
인공지능에 대한 기업 활용 사례(feat. 관련주)
* 인공지능 기술분야별 핵심 기업
구분 | 관련 기업 |
기계학습분야 | Google(Alphabet), Microsoft, Meta, Intel |
데이터센터, 클라우드 분야 | Google(Alphabet), Amazon, Apple, Meta |
데이터 관련 하드웨어 | NVIDIA |
인공지능 활용 | Tesla, Google, Microsoft, Meta 등 |
1) 자율주행 (Tesla, 현대차)
자율주행은 대표적인 인공지능 활용기술입니다. 테슬라의 자율주행 기술은 정말 전 세계적으로 독보적인 기술을 가지고 있습니다. 아직까지 테슬라만큼의 정교한 자율주행 기술은 아무 기업도 가지고 있지 못합니다. 그나마 현대차는 테슬라를 쫓아갈 정도의 기술력을 가지고 있을 뿐, Audi, Mercedes-Benz 등 독일 완성차 기업과 기술력 차이는 현저합니다.
2) 스마트 디지털 도우미
위에 한 번 언급했지만 Google Assistant, Apple Siri가 대표적입니다. 기본적으로 명령을 하면 듣고 응답하면서 제품의 행동을 바꿀 수 있는 제품에 들어있습니다. 우리나라도 여러가지 가전 제품들에 이런 기능을 포함시키고 있어 IoT 산업에 활용도가 높다고 할 수 있습니다.
3) 컨텐츠 추천 알고리즘
Netflix, Youtube, Spotify 등의 사례가 이에 해당됩니다. AI와 ML의 활용으로 정말 많은 플랫폼이 사용자 추천이라는 알고리즘을 만들고 있습니다. 기본적으로 사용자가 제공하는 데이터로부터 정보를 얻은 다음 자신의 데이터베이스를 사용하여 사용자의 요구에 가장 적합한 컨텐츠를 추천하는 기능입니다.
4) 은행
미국에서는 스마트폰을 통해 수표를 입금하는 옵션을 제공하고 있습니다. 이때 활용하는 기술이 바로 Generative AI 입니다. 수표의 위변조를 이미지를 통해 확인하고 서명의 위조 또한 방지하고 있습니다. 은행에서 직접 개발하지는 않는 걸로 파악하고 있습니다.
위에서 언급한 사례들은 대표적인 사례일 뿐, 실제로는 인공지능 기술이 정말 다양하게 우리 실생활에 적용되고 있습니다. 단편적으로 스마트폰의 얼굴인식 기능도 인공지능을 활용한 기술입니다. 이렇게 많은 분야와 산업에서 활용중임에도 불구하고 아직까지 많은 성장 가능성이 있는 영역이기도 합니다.
위에서 알려드린 Global 기업들은 인공지능 섹터에서 핵심 기술을 가지고 있는 기업입니다. 하지만 그 외에 우리나라도 Naver, Kakao 와 같은 데이터 플랫폼 기업들과 보안 관련 기업에서도 인공지능 기술 개발에 많은 노력을 하고 있으니 관심을 가져보시면 좋을 것 같습니다.
산업의 성장 가능성을 보고 투자섹터를 고르시고, 핵심기술을 가지고 있는 기업에 장기적으로 투자하시면 반드시 좋은 결과를 얻을 수 있습니다.
By. POLF
References
1. AI타임즈, "일상 생활 속의 AI, 12가지 사례"
2. AI타임즈, "알아서, 스스로 발전한다"
3. ETRI, "자동 기계학습(AutoML) 기술 동향"
4. MIT Technology Review, "Why GPT-3 is the best and worst of AI right now"
5. NIA, "주목받는 인공지능 9대 핵심 기술 분석 및 주요 시사점"
6. e4ds news, "엣지 AI 솔루션, 고성능·고효율 실현"
7. NVIDIA Blog, "엣지 AI 해부하기"
'[POLF] 재테크' 카테고리의 다른 글
PMI(Purchasing Manager Index), 구매관리자 지수의 정의, 종류 그리고 활용방법 (0) | 2022.12.24 |
---|---|
메타버스(Metaverse)의 정의, 핵심 기술, 대표 기업 (4) | 2022.12.22 |
인공지능 기술. 1부 - 인공지능의 정의와 관련 기술 (1) | 2022.12.18 |
미국 소매판매(Retail Sales) 의 정의 및 주식시장에 대한 영향 (0) | 2022.12.16 |
2022년 12월 FOMC 결과 리뷰 (0) | 2022.12.15 |
댓글