AI-900_Introduction to AI

Microsoft AI Certification AI-900

현재 인공지능 분야는 글로벌 클라우드 기술에 대한 경험과 데이터 과학자의 부족으로 인해 어려움을 겪고 있습니다. 기업이 AI와 머신 러닝을 제품 및 서비스에 통합함에 따라 해당 기술과 인력에 대한 수요가 급증하고 있고 기업과 조직은 데이터 과학 기술과 인공지능에 대한 폭발적인 수요 인력을 찾고 있으며, 해당 기술의 전문가를 고용하기 위해 엄청난 노력을 하고 있습니다. 이러한 역할에 대한 필요성이 점점 더 공급을 초과함에 따라 기술 격차가 증가하고 있습니다.

가트너의 보고서에 따르면 데이터와 AI 관련 분야는 올해 말까지 약 230만 개의 일자리를 창출 할 것으로 예상됩니다. 이 분야에 관심 있는 사람들은 기업이 데이터 과학, 비즈니스 분석 및 머신러닝, 인공지능 분야를 사용하여 제품에 혁신을 추구하며, 고효율의 가치를 제공하는데 도움이 되는 인사이트에 주목해야 합니다. 전문적인 인공지능 엔지니어의 길이 아니더라도 경영, 마케팅, 기획, 전략 분야의 취업을 위해서 인공지능을 이해하는 것은 매우 중요합니다.

취업 분야 : 데이터 과학자, AI 엔지니어, 인공지능 신제품 기획 등

• ML, AI에 대한 기초 지식을 갖출 수 있습니다.

• Azure에서 ML과 AI를 활용하여 필요한 서비스를 구현할 수 있습니다

01 Introduction to AI

이번 강의에서는 Azure 내 AI 기능과 여러 AI 사용 예시와 이에 대한 AI의 책임에 대해 설명합니다.

1.Azure 내 기능

1.1 AI란 무엇인가?

Software that imitates human capabilities(인간의 능력을 모방) - 과거의 데이터와 경험을 기반으로 의사 결정을 할 수 있습니다.

ex) 구름이 잔뜩 낀 날에는 비가 올 확률이 높다고 인지할 수 있습니다.

Recognizing abnormal events (비정상적인 이벤트 인식) - 정상적인 이벤트가 진행되지 않고 있음을 인식할 수 있습니다.

ex) 가방 끈 한쪽이 끊어져서 멜 수가 없는 상황을 인식할 수 있습니다.

Interpreting visual input (시각적 입력 해석) - 시각적으로 입력을 인지하고 파악할 수 있습니다.

ex) 이미지에서 과일의 종류를 분류하여 인식할 수 있습니다.

Under standing written and spoken language (서면 및 음성 언어 이해) - 사람의 음성과 언어를 이해하고 분석할 수 있습니다.

ex) papago , 구글 번역기에서 언어를 다른 나라의 언어로 번역할 수 있습니다.

Engaging in dialogues and conversations (대화에 참여) - AI가 사람과 대화에 참여하여 실시간 또는 주어진 질문에 대한 대답이 가능합니다.

ex) 인터파크-톡집사를 통하여 AI와 의사소통할 수 있습니다.

1.2 AI 워크로드

Machine Learning (머신 러닝) – 데이터 및 통계를 기반으로 모델이나 함수를 만들고 모델에 기반하여 미래의 데이터가 들어왔을 때 예측하는 방법

ex) 정상적인 차량을 학습하고 찌그러진 부분과 얼마나 차이가 있는지 분석합니다.

Anomaly Detection (이상 탐지)– 정상적인 상황이 아닐 경우 잘못된 상황임을 인지함. 비정상적인 패턴이나 이벤트를 감지하여 정상적으로 돌려놓는 방법

ex) 차량의 파손 상태 인지를 인지합니다.

Computer Vision(컴퓨터 비전) – 카메라, 이미지, 비디오의 시각적 입력을 해석하는 방법

ex) 자동차 번호판을 인지하고 판독합니다.

Natural Language Processing (자연어 처리) – 서면 또는 음성 언어를 해석할 수 있는 애플리케이션

ex) 차량의 파손 현황을 고객이 음성으로 녹음하면 AI가 음성 언어를 분석합니다.

Conversation AI (대화형 AI) - 대화형 AI인 챗봇을 통해 인간과 의사소통을 할 수 있는 방법

ex) 상담원의 통화가 어려울 시, 챗봇을 통해 수리 서비스 관련된 상담이 가능합니다.

1.3 Microsoft Azure의 AI

Data storage – Azure Storage 플랫폼은 최신 데이터 스토리지 시나리오를 위한 Microsoft의 클라우드 스토리지 솔루션입니다. 핵심 스토리지 서비스는 데이터 개체를 저장하는 대규모 확장 가능한 개체 저장소, Azure VM(가상 머신)용 디스크 스토리지, 클라우드용 파일 시스템 서비스, 신뢰할 수 있는 메시징의 메시징 저장소 및 NoSQL 저장소를 제공합니다.
Compute – 클라우드에서 제공되는 컴퓨팅 또는 서버 리소스를 의미합니다.
Services – 전반적인 제품 서비스를 의미합니다.

Azure Machine Learning – 코딩을 하지 않고 Drag&Drop으로 데이터를 불러와 분석하고 알고리즘을 만들어 모델링을 한 다음, 새로운 데이터를 넣어 검증 및 예측할 수 있습니다. ML(기계 학습)은 데이터의 수학적 모델을 사용하는 프로세스로서 직접 명령 없이 컴퓨터가 학습하도록 지원합니다. AI(인공 지능)의 하위 집합으로 간주됩니다. 기계 학습은 알고리즘을 사용하여 데이터 내의 패턴을 식별하고, 이러한 패턴을 사용하여 예측을 할 수 있는 데이터 모델을 만듭니다. 인간이 연습을 통해 개선하는 방식과 매우 흡사하게, 기계 학습 역시 데이터와 환경이 향상되면 결과도 더욱 정확해집니다.
Cognitive Services – Cognitive Services는 기계 학습 분야의 전문 지식이 없어도 모든 개발자가 손쉽게 AI를 사용할 수 있도록 지원합니다. API 호출만으로 보고, 듣고, 말하고, 검색하고, 이해하고, 의사 결정을 빠르게 내리는 기능을 앱에 포함할 수 있습니다. 다양한 기술 수준의 개발자가 앱에 AI 기능을 쉽게 추가할 수 있습니다.
ex) UBER – 택시 기사의 사진과 현재 얼굴을 인공지능이 분석합니다.
Azure Bot Service – 봇 서비스 개발 및 관리를 위한 클라우드 기반 플랫폼입니다. 데이터의 제어를 유지하면서 엔터프라이즈급 대화형 AI 환경을 개발합니다. 봇에 Azure Cognitive Services의 고품질 AI 기능을 적용합니다. 봇이 자연어로 그리고 브랜드를 떠오르게 하는, 브랜드만큼 고유한 단 하나 뿐인 음성으로 상호 작용할 수 있습니다.

2. AI의 책임

2.1 AI의 도전과 위험성

Bias can affect results(편견은 결과에 영향을 줄 수 있음)- 나쁜 편견에 의해 머신 러닝이 학습이 된다면 새로 만든 모델이 잘못 개발될 가능성이 크고 편견을 가질 수 있습니다.
Errors may cause harm (오류는 해를 끼칠 수 있음) - 자율 주행 차량, 병을 진단하는 인공지능 코딩의 오류가 있다면 치명적입니다.
Data could be exposed (데이터가 노출될 수 있음) - 환자 데이터의 노출, 개인 신변 및 보호 받아야 할 데이터들이 외부 유출 될 가능성에 대해 주의를 기울여야 합니다.
Solutions may not work for everyone (솔루션이 누구에게나 통하지 않을 수 있음) - 시각 및 청각 장애인 등 다양한 솔루션을 통해 사용할 수 있는 방법을 고려해야 합니다.
User must trust a complex system AI(사용자는 복잡한 시스템을 신뢰해야 함) - AI의 증권 상품 추천에 대하여 AI에 대한 신뢰가 없다면 AI 서비스를 사용하는 것이 불가능합니다.
Who's liable for AI-driven decisions?(AI가 주도한 결정은 누구 책임일까) - 인공지능 판사가 주도한 결정이 잘못될 경우 책임에 대한 위험이 존재합니다.

2.2 책임감 있는 AI가 되기 위한 원칙

Fairness (공정성) – 남자라 해서 여자보다 대출이 잘되면 안됩니다. 주어진 상황에 대해 공정해야 합니다.
Reliability & Safety (신뢰 및 안정성) - AI 기술에 대해 신뢰할 수 있어야 하고 오류 없이 안전해야 합니다.
Privacy & Security (보안 & 개인정보) – 국가마다 따라야 하는 컴플라이언스 이슈를 지켜야 합니다.
Inclusiveness (포괄적) – 정상적인 사람 뿐만 아니라 장애인들 또한 서비스를 누릴 수 있어야 합니다.
Transparency (투명성) – 모든 정보를 투명하게 공개할 수 있어야 합니다.
Accountability (책임감) –AI의 결정에 대한 책임감이 있어야 합니다.

02 Machine Learning

이번 강의에서는 Machine Learning과 Machine Learning 방법 및 Azure Machine Learning 에 대해 설명합니다.

1.1 Machine Learning이란?

과거의 데이터에서 관련성을 찾아 예측 하는 모델을 만드는 것
인공지능을 사용하기 전 과거 통계에서는 과거의 데이터를 모두 사용했지만 머신 러닝에서는 과거의 데이터를 두개로 쪼갭니다. (Split data)
Training Data - 학습 데이터를 통해 모델을 만듭니다.
Validation Data - 나머지 데이터를 모델에 넣어서 예측이 잘 되는지 검증합니다.
데이터는 보통 7:3 또는 5:5로 랜덤하게 행으로 분할합니다.

1.2 Regression (회기 분석)

회기 분석은 함수 식에 값을 넣어서 미래를 예측하는 분석 방법입니다.

왼쪽 이미지의 온도 별 자전거 렌탈 댓수 데이터 값을 통하여 오른쪽 이미지의 그래프를 그릴 수 있습니다.
데이터들의 연장선을 통하여 기울기를 확인할 수 있습니다.
그래프의 기울기를 통해 y절편을 구하고 함수식으로 표현할 수 있습니다. 즉, 모델은 함수식입니다.
함수식에 x값인 온도를 넣으면 그래프에서 편차가 발생하게 됩니다.
이러한 편차를 줄이고 정확한 예측 모델을 찾는 것이 머신러닝의 핵심입니다.

1.3 Classification (분류)

왼쪽 이미지의 당뇨병 환자 데이터를 통해 오른쪽 이미지의 그래프를 그릴 수 있습니다.
그래프로 만든 함수를 통해 Validation 값을 사용하여 예측을 진행합니다.
True는 실제 값과 예측 값이 같을 경우를 말하고, False는 실제 값과 예측 값이 다를 경우를 말합니다.
Positive는 1일 경우 표시하고, Negative는 0일 경우 표시합니다.
결론: 실제 값과 예측 값이 같고, 1이라고 예측할 경우, True Positive (TP)
실제 값과 예측 값이 같고, 0이라고 예측할 경우, True Negative (TN)
실제 값과 예측 값이 다르고, 1이라고 예측할 경우, False Positive (FP)
실제 값과 예측 값이 다르고, 0이라고 예측할 경우, False Negative (FN)

1.4 Clustering (군집분석)

왼쪽의 꽃 별 꽃의 키와 꽃잎 갯수 데이터로 오른쪽 그래프 위에 표현할 수 있습니다.
임의의 꽃과 꽃 사이의 중심이 되는 곳에 점을 찍습니다.
꽃과 가까운 점으로 묶습니다.
그룹의 중심점을 다시 찾습니다.
꽃과 꽃 사이의 거리를 계산하고 점(평균)들로부터 가까운 꽃들끼리 묶습니다.
반복적으로 묶고 평균을 내면 데이터 안의 비슷한 패턴과 구조를 발견합니다.

K-Means (K 평균 클러스터링)

K: 군집의 갯수, Means 군집의 중심과 데이터의 평균 값

2. Azure Machine Learning

2.1 Azure Machine Learning은 Azure Cloud 기반 머신러닝 플랫폼입니다.

Azure 구독 내에 ML Workspace가 들어있고, Workspace 내에 컴퓨팅, 실험, 데이터, 모델링, 서비스 등이 들어있습니다.

Azure Machine Learning designer를 통해 머신러닝 파이프라인을 생성할 수 있습니다.

2.2 Automated Machine Learning

Automated Machine Learning - 데이터를 넣고 어떤 알고리즘, 어떤 모델을 선택할지 사용자가 선택했지만, 데이터를 로드, 임계값을 정해주면 인공지능이 알고리즘을 테스트하여 가장 적합한 모델을 찾아줍니다.

'AI School' 카테고리의 다른 글

AI-900_Natural Language Processing (0)	2022.04.30
AI-900_Computer Vision (0)	2022.04.30
AI Schoo_AI-900 머신러닝 학습 (0)	2022.04.26
220422_Docker와 Kubernetes (0)	2022.04.22
220421_Azure 데이터베이스 (0)	2022.04.21