[DevLog] Future of AI & Data 2023 참석
개요
개요 : 2023년 9월 21일 ‘Future of AI & Data 2023’ 행사에 참석
주제 : ‘AI 로 진화하는 데이터 및 분석 전략’
요약
- 생성형 AI 를 사용한 비즈니스 기회 창출 시도 多
- 주요 포인트 : 생성형 AI 를 전문적으로 사용하기 위한 Model Tuning 및 시스템 구성이 시도되고 있음
- 기술 포인트
- 생성형 AI 중, 특히 ChatGPT 등의 LLM 에 집중하여 개발이 이루어짐
- 관련 솔루션으로, 기 보유한 신뢰 가능한 데이터 베이스를 토대로 RAG과 함께 생성형 AI (LLM) 을 사용하는 방식이 주로 소개됨 (메가존클라우드, VMWare)
- 생성형 AI는 만능 도구가 아니기 때문에, 사용할 모델이 ‘무엇을 잘 할 수 있는지’ 숙지한 뒤 사용해야 함
- 프롬프츠 학습을 위한 데이터 전처리가 중요
- 다양한 영역에서 DX, AI 에 대한 시도가 이루어지고 있음
- 인프라 운영 (e.g. IBM 솔루션), DataOps & MLOps (e.g. RedHat 솔루션) 등
- 주요 키워드 : 애플리케이션 자동 배포, 효율적인 운영, 선 오류 감지 시스템
- 기존에 데이터 과학자가 수동으로 처리하던 영역을 자동화하는 솔루션에 대한 니즈와 공급이 함께 성장한다는 인상
- 기타 감상 : 컨퍼런스 발표 시 구체적인 사례와 상세한 수치를 언급하면 집중도가 올라가는 효과가 있는 것 같음
Note-taking
Opening Keynote : 변화를 끌어내는 데이터 스토리텔링
연사 : 굴레즈 칸 (데이터 사이언티스트 리더, Paypal)
주제 : 데이터 작업 시 커뮤니케이션과 시각화의 중요성
“이 우주는 원자가 아니라 이야기로 이루어져 있다” - Muriel Rukeyser
- 데이터 시각화의 네 가지 원칙
- 스토리텔링의 중요성
- 회의에서 랩톱, 스마트폰 등을 들여다보는 현대의 풍경을 ‘이야기’로 변화시킬 수 있음
- 어떻게 데이터를 가지고 이야기를 창조할 수 있을까?
- 강연자가 본인의 아이와 함께 만든 ‘레고’에 ‘데이터’를 비유
- e.g. 레고 블록으로 열심히 어떤 형상을 만들어도 (= 데이터로 열심히 모델을 만들고 시각화를 해도), 아이에게는 이야기가 전달이 되지 않으면 의미 없는 피규어가 된다 (=고객에게는 이야기를 제시하지 못 했기 때문에 헛수고가 된다)
- 따라서 “스토리텔링” 이 중요
- 패널 활용
- 데이터 시각화는 대사 없는 만화를 그리는 것과 같음
- 색 활용
- 사용자와 고객에게 데이터를 빠르게 인지할 수 있게 하는 색 및 배치를 사용해야 함
- 색상이나 모양 등을 하나만 다르게 하는 것으로 청자의 집중을 유도할 수 있음
- 텍스트 활용
- 예를 들어, 그냥 그래프만 있어서는 주제를 알 수 없으나 X 축에 ‘월 별’ 이라는 정보를 넣으면 좀 더 이해하기 쉬워짐
- 애니메이션
- 동적으로 움직이는 것으로 변화를 보일 수 있음
- 스토리텔링의 중요성
- 데모 : 데이터 시각화 예시
- ‘고지서’ 예시 시연
- ‘방글라데시의 기적’ 예시 시연
- 결론 : 오래 걸려서 발굴하고 분석한 데이터를 청중에게 전달할 때, 적절한 시각화 방식을 사용한다면 더욱 효과적임
Expert Advice : DX를 위한 지능형 워크플로우 플랫폼에서 생성형 AI 활용법
연사 : 임광수 (상무, ServiceNow)
주제 : DX 시 생성형 AI 가 어떤 가치를 창출할 수 있을지?
“누가 가증 진보된 생성형 AI를 보유하느냐에 따라 경쟁 우위가 결정될 것이다.” - 글로벌CEO 설문 조사 중 75%의 답변
- AI 에 숨어 있는 잠재성
- 데이터 마이닝, ML, AI Ops 등이 모두 단일 지능형 플랫폼에 내재되어 있다면…
- Service now 에서 생성형 AI 를 어떻게 활용하고 있는지
- Generative AI + Now Platform 강점
- 경험 혁신 : end-user 에게 빠른 답변 제공, self-service 향상
- 생산성 가속화 : 조직원의 업무 자동화
- 민첩성 향상 : 빠른 기술 도입을 통한 최신화
- 정확히 어떤 일을 할 수 있는지?
- 태스크 요약
- 대화 형식의 의사 소통
- 콘텐츠 창작
- 텍스트에서 코드 만들기 (자동화된 코드 생성)
- 검색 강화
- 도메인 특화 LLM 을 사용한 Now Assist
- 노 코드 툴 제공
- 요청 시 workflow 를 자동으로 만들어 줌
- Generative AI + Now Platform 강점
- 데모 : Now Assist 를 활용한 Workflow 생성
- 개발자, 관리자, 직원 관점 각각의 예시
- 자동으로 workflow 를 생성하고, deployment 시 테스트를 생성 및 지원
- 메시지 요약 기능 사용 가능
- 특정 Request 에 대한 form 을 실시간 생성하고, 배너 이미지를 삽입 가능
- form 에서 인입된 응답들에 대한 관리 페이지를 자동 생성
Expert Advice : Data Silo로부터 Solution 으로 전환
연사 : 김세준 (상무 & 기술지원, Denodo Korea)
주제 : Denodo 의 솔루션을 사용하여 데이터 관리 효율을 높여 보자
- AI/ML 이니셔티브
- 데이터 증폭과 생성형 AI를 통한 무한한 비즈니스 잠재력
- 실제로 AI 도입이 역대 최대로 증가하고 있음
- 그러나 진짜 ‘좋은 데이터’ 를 사용하고 있는지는 의문
- 문제 제기 : 데이터 이슈
- 분산된 데이터로 인해 새로운 데이터 관리 문제 발생
- 문제 : 클라우드, 온프레미스 하이브리드로 인한 데이터 분산
- 솔루션 : 글로벌 데이터 관리 및 DataOps 를 도입하여 데이터 운영 간소화
- 데이터 관리가 복잡하고 느려짐
- 문제 : 표준 부족, 독점 메타데이터, 사일로화 된 정책
- 솔루션 1 : 엔드투엔드 통합 데이터 관리에 집중
- 솔루션 2 : 인텔리전스 및 민첩성을 위한 AI 기반 데이터 관리 우선 순위 지정
- 너무 많은 데이터를 사용
- 문제 : 너무 많은 데이터를 사용하기 때문에, 누락하는 데이터가 생기거나 데이터 처리에 지나치게 많은 시간을 소모
- 솔루션 : 간소화 되고 “지속적인 인텔리젼스” 가 포함된 프로세스를 사용
- 분산된 데이터로 인해 새로운 데이터 관리 문제 발생
- 논리적 데이터 전략의 실현 및 그 효과
- Denodo 가 어떤 방식으로 솔루션을 설계했는지 소개함
- 키워드 : ‘가상화 된 데이터’, ‘거버넌스’, ‘데이터 통합’
- 멀티 클라우드와 같은 다양한 위치에 분산된 기업 데이터 환경에서의 애널리틱스, 거버넌스, 개인정보 보호 실현 전략 소개
- 분석 대상 데이터에 대한 지식을 축적하고, 협업함
Expert Advice : HR 사례로 처음 시작하는 ‘엔터프라이즈를 위한 생성형 AI 프로젝트’
연사 : 공성배 (센터장, MEGAZONCLOUD)
주제 : 공기 같은 존재가 되어가는 생성형 AI - 실제 비즈니스에 적용한 사례를 중심으로
- AI 에 어떤 ‘페르소나’를 부여할 건지?
- 예를 들어, 닭을 세도록 학습한 AI 는 닭만 세고, 소를 세도록 학습한 AI는 소만 센다.
“내가 그의 이름을 불러 주었을 때, 그는 나에게로 와서 꽃이 되었다.” 김춘서 - 꽃 (中)
- LLM의 포텐셜을 인지하고, 역할과 과업을 특정
- 사람처럼 할 수 있는 범위 : 언어를 학습해서 사람처럼 구사할 수 있음
- 학습한 언어에 따른 역할
- 자연어 처리 → 상담사 (Q&A)
- 프로그램 언어 → 코드 개발자
- HR로 교육받은 사람이 데이터 분석을 하지 못 하는 것처럼, LLM 도 특정 역할을 하도록 교육 받고 해당 업무를 수행
- 생성형 AI 는 반짝 유행일까, 새로운 대세일까?
- 관심에서 실질적 대세로… 굉장히 많은 모델들이 나오고 있음
- e.g. ChatGPT 등
- But, 전망은 낙관적이나 전면적 도입은 제한되고 있음
- 생성형 AI 도입 시 기본 고려 사항
- 도입 초기 : 기술 초기 단계여서, 새로운 기술이 계속 나오고 있고 ‘정답’을 누구도 자신 있게 제공하지 않고 있음
- 구매 or 구축 : 직접 구축할 것인지, 혹은 구매할 것인지에 대한 결정이 필요
- 신뢰성 : 생성된 정보는 정확한 답변과 최신성, 정보 오류 방지 등 신뢰할 수 있어야 함
- 적용 업무 : 기업에서 사용할 수 있는 기술과 역할을 파악하고 적절한 서비스 선택이 필요
- 데이터 보호
- 비용 : 직접 사용할 시 GPT 운영 비용 등을 고려해야 하며, API Call 시 토큰 당 비용 등을 고려할 필요 있음
- 생성형 AI 시장
- Foundation Models
- Applications
- Google, Microsoft 365
- AWS 등에서 재공하는 SaaS-based apps
- Enabling Tools
- 관심에서 실질적 대세로… 굉장히 많은 모델들이 나오고 있음
- 사례 : 메가존클라우드 Pilot 프로젝트
- 개요
- HR 을 대상으로 9주 정도 진행한 프로젝트
- HR 시 반복되는 질의가 많고, 일정 시즌에 문의가 집중됨
- 목표
- ‘Megaone Ask’ 라는 플랫폼을 활용해서 반복되는 질의 응답을 줄이기 위함을 목표로 설정
- 범위
- 한글 LLM 선정
- 규정집을 사용하여 한글 LLM 을 Fine-Tuning
- 한글 LLM, LangChain, KB 를 AWS 환경에서 연계하여 검증
- HR Chatbot 시나리오 검증
- 프로세스
- 시나리오 작성 (e.g. 교통비 한도 문의)
- 질문 인입, 모델 활성화
- 연관 정보 검색
- RAG (Knowlege Base, AWS Kendra) 검색
- 연관 정보 추출
- 질문과 연관 정보 결합
- API Layer Endpoint For Prompts/Text Embedding
- 결론
- 데이터 준비
- 문답 정리, 문서 Chunking
- 데이터 전처리 (개인정보 제거, 감사 인사 등 매크로 데이터 제거)
- 아키텍처
- AWS Kendra 사용
- Input 을 Amazon SageMaker Endpoint-LLM 으로 넘김
- 사용 모델
- KULLM 사용 (12.8b 기준 파라미터 수 : 약 12.8억 & 모델 크기 : 약 26 GB)
- RAG (Retrieval Augmented Generation)
- Fine-Tuning
- Prompt Engineering
- 목적에 대한 정답 or 답변 정확도 향상
- e.g. 중복 답변을 하지 않도록 하는 방향으로 학습
- Chatbot Persona
- e.g. 최초 프롬프츠에서 “반드시 문서 내에서 답을 찾아 답변한다” 등의 지침을 줌
- 시나리오 작성 (e.g. 교통비 한도 문의)
- 한계
- 생성형 언어 모델의 태생적 한계로 인해, 한글에서 답변 제어가 쉽지 않음 → 별도 처리가 필요함
- 확장 및 production 전략
- LLM 모델 다양화
- RAG 전략 세분화
- Chatbot 프로세스 개선
- LLMops 표준화
- 개요
- 결론 : 메가존클라우드에서 GenAI360 오퍼링을 지원하며, 위와 같은 시행착오를 통해 얻은 경험을 토대로 언제든 고객에게 맞는 지원이 가능함
Expert Advice : 대규모 AI 기반 데이터 플랫폼 구축 전략
연사 : 현지수 (이사, VMware)
주제 : 생성형 AI 를 데이터 플랫폼에 적용하기 위한 전략
“인공지능이 당신을 대체하진 않겠지만, 인공지능을 사용하는 사람이 당신을 대체할 것입니다.”
- 생성형 AI와 LLM 의 AI활용 가속화
- 트랜스포머 모델 발달
- 전이 학습
- 개방과 공유 플랫폼
- 공개된 범용 모델 API 를 비즈니스에 활용해도 괜찮을까?
- 아래와 같은 문제가 있을 수 있음
- 데이터 보안
- 지식 단절 : Big Tech 기업이 배포하는 pretrained LLM 의 제한 문제
- 환각 : e.g. 법원에서 가짜 사건을 인용하여 망신을 산 사례
- 용도 : 전문성이 떨어지는 이슈 있을 수 있음
- 따라서, Private Infra 환경을 구축하는 것을 추천
- 아래와 같은 문제가 있을 수 있음
- 생성형 AI를 기업이 도입하고자 할 때를, 데이터 플랫폼 관점에서
- AI 모델에서 데이터는 매우 중요
- 데이터 처리 속도가 중요함
- 데이터 샘플링, 전처리, 모델링 (하이퍼파라미터 튜닝), 리팩토링, 스코어링을 반복하게 됨
- 이 때 순차 처리 되던 부분을 병렬 처리로 전환하면 시간 감축 효과가 있음
- RAG 기법을 이용하여 생성형 AI 의 환각 현상 회피
- 시나리오
- 사용자의 질문 입력
- Retrieval 단계에서, 의미 기반 검색을 하고 검색 결과를 반환함
- Generation 단계에서, 질문 + 프롬프츠 + 검색 결과를 LLM 에 입력하여 정답을 생성
- 생성된 답변을 출력
- 시나리오
- AI Platform Blueprint
- 운영, 데이터 레이크, 시스템 로그
- ETL 을 통해 Data Platform 으로 전달
- Private AI 사용
- 이 때, RAG 기법을 활용하기 위해 vector 연산 기능도 필요함
- 결론 대규모 AI 기반 데이터 플랫폼 구축 전략
- AI 플랫폼 중심의 거시적 관점에서 데이터 고려
- 데이터 처리 및 연계 성능, 벡터 연산, 고급 분석 고려
- 성공적인 AI 서비스를 위한 전담 조직 역량 강화
Expert Advice : 엔터프라이즈 오픈소스를 이용한 MLOps 구현
연사 : 이명진 (이사, RedHat)
주제 : RedHat MLOps 솔루션 (RHODS) 소개
- MLOps 란?
- 운영 환경에서 AI & ML 모델은 안정적이고 효율적으로 배포 및 유지하는 것을 목표로 하는 도구
- DataOps + ModelOps + Intelligent app DevOps 라고 생각할 수 있음
- Intellignet App (지능형 앱) 의 정의
- e.g. 모기지 페이먼트 계산기 앱과 모기지 승인 앱 중 어느 쪽이 지능형 앱일까? → 데이터를 사용하여 학습하는 모델에 의존하는 ‘모기지 승인 앱’이 지능형 앱이라고 할 수 있음
- 예시
- 추천 엔진, 가상 비서, 사기행위 감지, 양적 위협 계산을 통한 현명한 의사 결정, 패턴 감지, 특화 데이터 분석, 비디오 게임을 하는 AI, 텍스트 분석, 의료, 고객 유지 …
- MLOps 구축 시 장점
- 데이터 과학자와 개발자의 업무 간편화
- 패키징 프로세스 자동화
- 코드 및 모델 배포가 운영환경까지 진행
- Regression 테스트 파이프라인을 통해, 버그가 있는 코드나 잘못된 모델 사용을 방지
- Drift 된 모델에 대한 경고 가능, 위험 최소화
- MLOps 용 RedHat 하이브리드 클라우드 플랫폼의 경제적 영향
- AI 기반 금융 서비스 앱을 자동화 할 때 겪은 어려움을 조사
- 주요 당면 과제
- 기업의 데이터를 완전히 활용할 수 없음. 도구 부재
- 확장, 반복 가능한 프로세스 지원하지 않음 (가시성 부족에 따른 중복 작업)
- 단절된 프로세스
- 보안 기준이 엄격함
- 해결 방안
- 일관된 도구 사용
- 셀프 서비스 기능 도입
- 인프라 자동화
- ROI 개선
- MLOps 도입 후 개선점
- 데이터사이언티스트 효율성 향상
- 소프트웨어 개발자 시간 절감
- 인프라 절약
- MLOps 없이 AI & ML 할 시의 어려움
- 자동화 되지 않은 프로세스를 사용할 시 아래와 같은 이슈 발생
- 시간이 많이 걸림
- 오류가 발생
- 확장이 어려움
- 일관성 부족
- 보안 저하
- 민첩성 부족
- 데이터 과학 실험의 운영 배포 시 당면 과제
- 수동 학습의 떨어지는 일관성, 느린 속도
- 실 환경 결과와 자동화된 테스트 없이는 iterate 하기 어려움
- 모델 서빙 시 겪는 어려움
- 테스트 신뢰도 저하
- 자동화 되지 않은 프로세스를 사용할 시 아래와 같은 이슈 발생
- RedHat MLOps 솔루션 소개 (OpenShift AI)
- 주요 피쳐
- DataOps, MLOps 에 대한 CI & CD 제공
- Private, Public 하이브리드 등 클라우드 플랫폼 제공
- 생성형 AI 모델 중심의 RedHat 전략
- IBM Research 와 공동 협업으로 생성형 AI 분산 워크로드를 위한 인프라 개발 진행
- 기반 모델을 구축할 계획은 없으나 모델 개발사들과 협력하여 모델들을 제공할 예정
- 주요 피쳐
- 데모 : RedHat Openshift Data Science
- 대시보드 및 사용 방법에 대한 설명
- 사용자 인터페이스에서 서드-파티 리소스를 사용 가능할 수 있음
- Huggingface 에서 Pretrained Model 을 받고, Fine-Tuning 한 뒤 onnx 로 모델 변환하고 실제 서비스에 deployment
Expert Advice : AI를 활용한 IT 운영의 혁신 : AIOps 플랫폼
연사 : 김혜영 (실장, 한국IBM)
주제 : AIOps 의 개념 소개 및 실제 사례 적용을 통한 솔루션 소개
- 디지털 가속화
- 2024년까지 모든 신규 앱의 70%가 클라우드 기반이 될 것
- 조직의 65% 가 프로덕션에서 kubernetes 를 사용
- 2024년까지 조직의 81%가 멀티 클라우드가 될 것
- 디지털 가속화로 관리할 시스템과 IT Data 가 증가하고 있음 (과거 대비 100 배)
- 혁신은 좋지만, 기존 모니터링 솔루션은 모니터링 도구의 파편화 및 기존 모니터링 작업의 비효율적인 수동 프로세스로 인하여 사고가 발생한 후에 시스템에 대한 가시성을 제공
- AIOps (Artificial Intelligence for IT Operations)
- 인공지능 기술을 사용하여 IT 운영 관리를 단순화하고, 문제 해결을 단순화 & 자동화
- 사용 시 장점
- IT 데이터 사일로 해제
- 시스템에 대한 실시간 통찰력 제공
- AI 로 사전에 이상징후를 탐지, 사고 관리 강화
- 사고 해결 자동화
- 필요 플랫폼 역량
- 도메인 간 데이터 수집 및 분석
- 암시적 및 명시적 자원에서 자산 관계와 종속성을 분석한 토폴로지
- 인시던트와 관련된 중복 이벤트 간의 상관 관계 파악
- 선행 지표 감지를 위한 인시던트 패턴 인식
- IBM AIOps 의 지능형 IT 운영 자동화 플랫폼
- 가시화, 최적화, 자동화
- e.g. CloudXper 운영 가시성 확보
- End to End Observability : 지속적으로 증가하는 CloudXper 서비스를 제공하기 위한 애플리케이션 증가로 복잡해진 운영 환경의 인프라에서 쿠버네티스 네트워크까지 가시적으로 관리
- IBM Turbonomic; Container Spec Resize : AI를 사용하여, 기존 컨테이너에 할당된 자원이 부족할 시 resize 를 추천
- IBM Cloud pak for AIOps; Pubilc Cloud Account Permission : 사용자 권한 등의 이슈로 정보 수집 로직이 완료되지 않은 경우 AIOps 에서 도출
- IT 운영 전반에 IBM AIOps 의 다양한 AI 모델을 활용
- 데모 : AIOps 를 사용하여 변화한 운영 팀의 업무
Expert Advice : PostrgreSQL 의 효율적 활용 및 엔터프라이즈 데이터 전략
연사 : 이강일 (지사장, EDB Korea) 주제 : EDB와 EDB Postgres 제품군을 소개
- DBMS 선호도
- 2021년 기점으로 Open Source DB 가 상용 DB를 추월
- e.g. StackOverflow 에서 실행한 설문조사에서 ‘PostgreSQL’ 이 1위를 차지
- Open-source S/W 가치
- 비용 절감
- 빠른 Time-to-Market
- 배포 유연성
- 종속성 해결
- 혁신, 미래 지향
- Database 의 미래
- DB 를 선택할 때는 업무 특징을 파악하는 것이 가장 중요
- Legacy DB 에서 Open Source DB 로 많은 DB가 대체되고 있으며, 핵심은 ‘Postgres’
- EDB 소개
- 2004년에 설립된 오픈소스 DB 전문 업체
- 전문가 지원을 구독 형태로 하는 비즈니스 모델
- PostgreSQL 의 창립자 및 커뮤니티 코어 멤버 전원이 소속
- 내년도에 AI 와 함께 사용 가능한 형태의 데이터베이스 제품 출시 예정
- EDB Postgres Family
- PostgreSQL
- EDB Postgres Advanced
- EDB Postgres for Kubernetes
- EDB Postgres Distributed
- 국내 고객사 사례
- 통신, 제조, 금융, 공공, 커머스, 유통 등의 다양한 영역에서 Postgress 제품을 도입
- 오라클과 95% 이상 호환되는 유일한 오픈소스이기 때문에, 오라클 DB 를 대체하기 위한 용도로 많이 문의
Closing Keynote : AI의 확실한 이해와 적용: 가치를 높이기 위한 강점과 한계의 이해
연사 : 줄리오 본타디니 (IT Director, P&G)
주제 : 생성형 AI 의 개념과 한계, 그리고 창출 가능한 가치에 대하여
“단어는 주변에 있는 단어로 이해할 수 있다”
- 최신 AI 에 대한 이해
- Algorithm 과 Artificial Intelligence 를 구분하는 것이 중요
- Alogrithm : 계산, 반복 업무, 체스 등 룰이 정해진 게임
- Artificial Intelligence : 한 가지의 규칙으로 정의될 수 없는 태스크 (e.g. 외국어를 배우는 것), 비정형 데이터를 다루는 것 (e.g. 사진, 음악 등의 데이터 처리, 텍스트에서 감정을 인식하거나 요약하는 것)
- Algorithm 과 Artificial Intelligence 를 구분하는 것이 중요
- 생성형 AI의 이해
- 생성형 AI 가 핫하지만, 그것은 아래와 같은 문제가 있음
- 모든 문제에 대해 정답을 말하는 도구는 아니며, 때로 오답을 정답처럼 말한다
- 수학 문제를 풀 수 없음
- 혁신적이고 창의적인 아이디어의 source 가 될 수 없음
- 생성형 AI는 몇 가지 예제를 토대로 그것을 일반화 할 수 없음
- 그럼에도 생성형 AI는 이런 일을 할 수 있음
- e.g. ‘킹’ - ‘남자’ + ‘여자’ = ‘퀸’ 을 연산할 때, 모델은 ‘벡터 연산’을 수행하여 문제를 해결
- 컴퓨터는 단어의 위치에 따른 의미를 연산할 수 있음
- 단어의 Context 를 사용할 수 있음
- 따라서, 생성형 AI 가 합리적 주체는 아니지만 사람의 표현을 ‘이해할 수 있다’고 생각할 수 있음
- 생성형 AI 만으로도 컴퓨터를 보는 시각은 달라질 수 밖에 없음
- 생성형 AI 가 핫하지만, 그것은 아래와 같은 문제가 있음
- 생성형 AI 의 가치
- (과거) 컴퓨터는 ‘이해’ 하지 못 한다 → (2017) ‘Attention is all you need’ 발표 → (2018 ~ 2022) 수직 처리가 아닌 병렬컴퓨팅 사용 → (2022) ChatGPT 발표, 컴퓨터는 사람의 표현을 ‘이해’ 할 수 있음
- 생성형 AI의 발전을 통하여 knowledge management 의 다음 level 이 생기게 됨
- (문자 이전) 정보는 저장될 수 없음 → (문자 이후) 정보를 저장할 수 있음 → (인쇄 이후) 정보가 대중화 됨 → (컴퓨터 간 연결 가능) Web 을 통하여 디지털 지식을 활용하게 됨 → … 그렇다면, 컴퓨터가 정보를 ‘이해’할 수 있게 된다면?
- 따라서 생성형 AI 는 1992 년 인터넷의 발명과 동일한 수준의 발명이 될 수도 있음
- 가정형인 이유는, 아직 그것이 사실이 될지 아무도 모르고 있기 때문
- Implication
- 아무도 이것이 어떻게 될지 모르기 때문에, ‘Stay Open’ 해야 함
- Old Truths Still Stand
- ‘How’ 가 아니라 ‘What’ 에 집중한다 (생성형 AI가 ‘How’ 다)
- Value creation must be defensible (e.g. 아이폰 자체에서 ‘플래시’ 기능을 지원하면서, 플래시 앱은 사라지게 되었음)
- The Big Change
- 기존에 컴퓨터를 ‘실수 없는 계산’을 하기 위해 사용했던 것과 달리, 생성형 AI 는 ‘실수가 있어도 되는 것’ 에 사용한다
- Augmentation of expressioni Programming
- Maieutic thinking
- e.g. 메일을 쓰기 위한 여러 가지 표현을 구상하는 것
- e.g. 프로그래밍을 할 때 자동 코드를 생성하는 것 (생성형 AI가 실수를 해도, 사용자가 컨트롤 할 수 있다면 해당 실수를 수정하기만 하면 되기 때문에 전체 과정이 엄청나게 단축된다)
- 기존에 컴퓨터를 ‘실수 없는 계산’을 하기 위해 사용했던 것과 달리, 생성형 AI 는 ‘실수가 있어도 되는 것’ 에 사용한다
- New Risks
- 새로운 책임이 따름
- 시장마다 규제가 다르기 때문에, 그 규제를 준수해야 함
- 생성형 AI 에 입력되는 데이터의 소유권에 대한 생각
- 사회적 지속 가능성을 고려해야 함
- 새로운 책임이 따름
- 결론 : 인공지능은 분명히 돌파구이고, 생성형 AI는 ‘모든 것’을 해줄 수 없지만 분명히 ‘뭔가’를 해줄 수 있음. 그리고 그것이 큰 가치를 가지고 있을 것임