본문 바로가기
지속적수입(디지털노마드)

데이터라벨링 기초이론 공부요약

by 썸씽쉐어 2023. 4. 2.
728x90
반응형

데이터 라벨링

인공지능 알고리즘 고도화를 위해 AI가 스스로 학습할수 있는 형태 데이터를 가공하는 작업

 

 

데이터 정제

데이터의 오류제거

필요한 형식이나 크기에 맞게 변형

불필요한 데이터의 제거

개인정보 비식별화 처리

 

 

 

2025년 매일 463엑사바이트 데이타 생성 예정

 

데이터유형

이미지, 영상, 덱스트, 오디오

 

 

이미지데이터 작업내용

바운딩박스

이미지에서 추출하고자하는 대상을  네모난 박스로 표시하는 라벨링 기법

 

태깅

대표할수 있는 키워드를 달아줌으로써 대상을 분류하는 작업

 

감정분석

해당되는 감정을 태깅하거나 글로 묘사하는 방식으로 진행

 

키포인트

마우스를 클릭하여 점을 찍는 작업으로 각 특징점을 비교하여 이미지를 매칭하거나 특징점을 연결하여 

골격을 추출하는 기술

 

얼굴랜드마크

마우스를 클릭하여 점을 찍는 작업

안면인식과 표정변화를 통한 감정인식 기술에 활용

 

OCR

AI가 인간의 글을 인식하게하는 라벨링 기법

글자를 바운딩한후 태깅이나 전사로 함

 

폴리곤, 폴리라인

점으로부터 시작하여 선의 형태로 이어지는 기법

 

 

영상데이터 작업내용

바운딩

영상대상을 박스에  넣어줌

 

스켈레톤 추출

행동패턴을 분석하기 위해 특정부위에 점을 찍어줌

 

특정구간추출

말이나 행동의 특정구간만 추출함

 

시멘틱세그멘테이션

폴리폰, 폴리라인으로 이미지 내에 위치 및 모양등을 영역으로 분류하는 작업

 

덱스트데이터 작업내용

문장의미 비교

 

감정태깅

 

키워드 찾기

 

문장요약

 

음성데이터 작업내용

화자구분

 

음성받아 쓰기

 

 

 

반응형

댓글