AICE 자격증 학습 블로그 챌린지 (2일차)
다음은 제공된 2일차 스터디 플랜이다.
열심히 들은 흔적(?)... 오늘은 대부분 실습 위주로 블로그에 어떻게 올려야할지 잘 모르겠지만 일단 최대한 정리해보겠다. 막상 실행하면 정말 쉽고 간단해서 실습 방법은 굳이 외울 필요는 없을 듯하다
1. 환경구성 및 데이터 가져오기(실습)
- AICE 홈페이지 접속 및 회원가입, 로그인 : https://aice.study/
- AICE 실습실 들어가기 : 상단 배너의 AICE 실습 -> 나의 프로젝트
- 기본 프로젝트 클릭 후 세부 옵션 조정
(각 페이지를 올리면 너무 의미없이 길어질 것 같아 각 메뉴의 간단한 기능 소개하고 스킵)
- 기본정보 : 자원 현황과 같은 Dashboard 조회
- 프로젝트 멤버 : 프로젝트 멤버 등록(프로젝트 내 데이터와 소스코드 공유)
- 데이터 관리 : PC Data 업로드
- 소스 Viewer : 프로젝트 멤버별 작업공간 조회
- 분석IDE : Jupyter lab(소스코드 기반) 또는 AIDU ez(GUI + 클릭 기반)
- 모델학습 : AI 모델 학습
- 공유모델 : 생성된 AI 모델 테스트
- AIDU를 선택한 후 개발자 환경 조정을 통해 버전 선택과 시스템 자원 설정을 할 수 있다
2. 데이터 분석 실습하기(실습)
- 데이터를 가져온 후, 왼쪽 탭의 데이터 분석을 통해 손 쉽게 데이터를 분석할 수 있다
- 기초정보분석 : 데이터의 전체적인 통계 정보
- 시각화 분석 : 산점도 / 히트맵 / 박스차트 / 분포차트 / 워드클라우드
- 비지도 학습분석 : 차원 축소(PCA, t-SNE) / 군집분석(K-Means, Hierarchy)
- 데이터 샘플 보기
3. 데이터 가공 실습하기(실습)
- 범주형/텍스트 데이터
-- 결측값 처리 : 수치형 데이터와 달리 최빈값, 고정값으로만 보완
-- 데이터 변환 : 범주형 데이터를 수치형으로 변환하는 Encoder 사용
-- Regex 추출 : 정규 표현식 추출
-- 자연어 처리 : Komoran, Hannanum을 활용한 형태소 분석 및 명사 추출
- 수치형 데이터
-- 결측값 처리 : 최빈값, 평균값, 중간값, 고정값으로 보완
-- 데이터 변환 : Transformer을 이용한 데이터 분포, Discretizer를 활용한 연속 데이터 이산화
-- Scale 조정 : 데이터 Feature 마다 다른 데이터 Scale을 통일하기 위한 Scaler(Min-Max / Standard)
- 왼쪽 탭의 데이터 가공을 통해 손쉽게 데이터를 가공할 수 있다
4. AI 모델링 & 머신러닝 이해하기(이론)
- AI 적용 프로세스 : 문제 정의 - 데이터 수집 - 데이터 분석 및 전처리 - AI 모델링 - AI 적용
-- 1. 문제 정의 : 얻고자 하는 게 무엇인가?
-- 2. 데이터 수집 : 어떤 종류의 데이터를 얼마나 확보할 수 있는가?
-- 3. 데이터 분석 : 데이터의 분포와 연관관계는 어떠한가? 의미 있는 데이터는?
-- 4. AI 모델링 : 어떻게 학습시킬 것인가? 어떤 항목을 활용할 것인가?
-- 5. AI 적용 : 모델의 성능은? 모델을 어떻게 활용할 것인가?
- AI 모델링 : 비지니스 문제를 파악한 후 이를 해결하기 위한 머신러닝(인공지능) 문제로 전환
- Hyper Parameter(초매개변수) : 사용자가 직접 적용하는 세팅값
- Dropout : 과적합을 줄이기 위해 임의로 노드를 제거하는 확률
- Optimizer : 파라미터를 업데이트하기 위한 최적화 알고리즘 종류
- Epoch : 전체 데이터 샘플을 학습하는 횟수
- Batch Size : 1회 파라미터 업데이트를 위해 학습하는 샘플 개수
- Early Stop : 학습 조기종료 옵션
- Train / Validation / Test : 훈련/검증/시험으로 각각 학습지/모의고사/수능
5. 정형 데이터 모델링 실습하기
- 왼쪽 탭에서 AI모델 학습을 통해 손쉽게 AI모델을 학습시킬 수 있다(이후 활용하기 위해서는 학습 후 저장해야 함)
- 모델 성능 평가 방법
6. 학습 모델 활용하기
- 왼쪽 탭에서 AI모델 활용을 통해 손쉽게 저장한 AI모델을 활용할 수 있다
- AI 모델 활용 : 분석하기 / 변수 영향도 확인 / 시뮬레이션 / 예측하기 / 다운로드하기 / 삭제하기
-- 분석하기 : 모델의 성능평가 지표 재확인
-- 변수 영향도 확인 : 모델에 기여한 변수 영향도 확인
-- 시뮬레이션 : 모델을 사용해 특정 샘플에 대한 시뮬레이션 진행
-- 예측하기 : 모델을 사용해 데이터에 대한 예측 실행
-- 다운로드하기 : 모델 다운로드
-- 삭제하기 : 모델 삭제
나머지는 위의 기능들을 활용한 타이타닉 데이터 실습인데, 위의 내용 그대로 적용하는 거라 스킵
정말 편리했는데, 이렇게 보급하면 확실히 코딩을 못하는 타 전공자들도 손쉽게 자신의 도메인에서 활용할 수 있을 것 같다
'대외활동 > AICE대학생 서포터즈' 카테고리의 다른 글
[AICE 자격증] AICE Basic 시험 후기 및 팁 (2) | 2024.03.16 |
---|---|
[AICE 자격증] AIDU ez 실습 [분류] : 중공업 선박 수주 여부 예측 (7일차) (1) | 2024.03.14 |
[AICE 자격증] AIDU ez 실습 [분류] : 항공사 고객 만족 여부 예측 (6일차) (0) | 2024.03.14 |
[AICE 자격증] AIDU ez 실습 [회귀] : 음원 흥행 가능성 예측 (5일차) (0) | 2024.03.12 |
[AICE 자격증] AI 구현 프로세스_2 (4일차) (0) | 2024.03.07 |
[AICE 자격증] AI 구현 프로세스_1 (3일차) (0) | 2024.03.06 |
[AICE 자격증] AI의 이해 (1일차) (1) | 2024.03.04 |
[AICE 자격증] 학습 블로그 챌린지 시작 (0) | 2024.03.04 |