(구) 웹진거북이

(210830) 인공지능 학습용 데이터 라벨링 전문 교육생 모집

2021년
작성자
최정우
작성일
2023-01-09 18:03
조회
48

인공지능(AI)의 발전과 함께 ‘데이터 라벨링’ 산업이 떠오르고 있다. 데이터 라벨링은 AI 학습 데이터를 만들기 위해 원천 데이터에 값(라벨)을 붙이는 작업이다. 자동화가 어려운 작업으로, 사람이 일일이 데이터에 라벨을 붙여야 해서 ‘AI 눈알 붙이기’라고 불리는 등 IT업계에서의 막노동으로 인식되었다. 그러나 최근 들어 업체들이 데이터 라벨링 반자동화 툴을 만들어 인력과 비용 절감을 꾀하면서, 다른 AI 기술들처럼 자동화되어가고 있다.





최근 정부가 실시한 ‘디지털 뉴딜’ 정책에 따라 데이터 라벨링도 함께 주목받고 있다. 디지털 뉴딜 정책은 코로나19로 인한 경제 위기를 극복하기 위한 D(Data) N(Network) A(AI) 기반의 대한민국 회복 전략이다. 코로나19로 인해 온라인 소비, 원격근무 등 비대면화가 확산되며 ‘디지털 역량’이 국가 경쟁력의 핵심 요소로 떠오르고 있다. 이러한 요소에 중점을 두며 대한민국 기술의 강점인 ICT(정보통신기술)를 전 산업 분야에 융합함으로써 경제 위기를 극복하고 새로운 일자리를 창출하고자 하는 ‘국가 디지털 대전환 프로젝트’이다.



 












▲ 디지털 뉴딜 로고



 


데이터 라벨링은 디지털 뉴딜 정책의 핵심이라 할 수 있는 AI 산업 육성에 필요한 작업이다. 올해 하반기에만 2,925억 원이라는 예산이 투입될 ‘AI 학습용 데이터 구축’에서의 데이터 라벨링의 수요 또한 상당할 것으로 예상된다. 이처럼 인공지능에 없어서는 안 될 데이터 라벨링에 대해 더 자세히 알아보도록 하자.





데이터 라벨링은 AI의 딥러닝 활용에 필수적인 작업으로써 주목받기 시작했다. 딥러닝은 대량의 데이터로 학습을 진행하며, 학습 모델은 정답을 맞힐 수 있는 방향으로 진화하는 과정을 거친다. 이때 학습에 사용되는 데이터에는 데이터값이 미리 매겨져야 있어야 한다. 이때 올바른 데이터 값을 구축하기 위한 작업이 데이터 라벨링에 해당한다.





‘학습 데이터’는 AI 학습 모델의 정확도를 높이고 고도화하기 위한 정답지 역할을 한다. 데이터 라벨링은 이를 구축하는 과정으로, 컴퓨터가 알아들을 수 있도록 비정형 데이터를 알기 쉽게 변형하거나, 가공하는 과정을 뜻한다. 예를 들어, 자동차가 찍혀있는 사진을 보고 사람들은 사진 속 사물이 자동차라는 것을 쉽게 파악할 수 있지만, 컴퓨터는 이를 자동차로 인식하지 못한다. 그러므로 컴퓨터가 인식할 수 있도록 사진 위에 자동차의 위치와 크기를 입력하고, 그 위치와 크기 안에 있는 이미지를 ‘자동차’라고 표시하는 작업이 필요하다. 이러한 과정을 데이터 라벨링이라 할 수 있다.



 












▲ 데이터 라벨링 일러스트



 


앞에서 언급한 것처럼 데이터 라벨링은 이미 예전부터 수작업의 형태로 존재했으며, 최근 들어 그동안 수작업으로 해왔던 일을 툴을 통해 할 수 있게 됐다는 점이 주목되었다. 김현수 슈퍼브에이아이 대표는 “과거의 데이터 라벨링 작업은 사람이 직접 사물이 위치한 곳에 사각형 경계선을 긋는 형태로 진행됐지만, 현재는 3D 데이터에 맞춘 3차원 가공도 진행되고 있다. 앞으로 데이터 가공은 더 복잡하고 정교해질 것이다.”라고 설명했다. 이어서 “과거 사람이 직접 라벨링 작업을 했기 때문에 ‘인형 눈알 붙이기’로 비유되었는데, 현재는 라벨링 자동화 툴을 통해 데이터 라벨링을 진행하기 때문에 ‘인형 눈알 붙이는 기계’를 사용해 인간이 작업하는 것과 같다.”라고 덧붙였다.





이처럼 데이터 라벨링이 주요 산업으로 떠오르면서, 데이터 라벨링 전문 기업에서 용역을 받아 수행하는 프로젝트의 기본 데이터를 수집 및 가공하는 ‘데이터 라벨러’ 역시 주목받고 있다. 8월 기준으로 국내 관련 종사자는 30만 명 이상에 달하는 것으로 알려졌다.















▲ 데이터 라벨러 육성에 나선 스타트업





 


네이버 스타트업 양성 조직 D2SF가 투자한 크라우드웍스, 엘리스, 아토머스, 펫페오톡, 딥픽셀 등 5개 스타트업은 인공지능 데이터 라벨러 육성에 나선다고 밝혔다. 전체 사업 운영은 25만여 명의 라벨러 회원을 토대로 직무 전문성과 작업 체계 전반에 대한 노하우를 보유하고 있는 AI 학습 데이터 플랫폼 기업 ‘크라우드웍스’가 맡았다. 이외 비대면 심리상담 기업 ‘아토머스', 반려동물 행동 분석 기업 ‘펫페오톡', 가상 피팅 솔루션 기업 ‘딥픽셀’은 각 전문분야에 특화한 교육 콘텐츠를 제작하고, 제작된 콘텐츠는 ‘엘리스’의 온라인 교육 플랫폼을 통해 제공될 예정이다.





한편, 과학기술정보통신부와 한국지능정보사회진흥원(NIA)은 인공지능(AI) 학습용 ‘데이터 라벨링’ 전문 교육 사이트를 신규 개설하고, 교육 참가자를 모집한다고 밝혔다. 이번 교육은 AI에 대한 윤리 및 이해, 데이터 라벨러 전문 과정의 역량을 강화하기 위해 진행된다. 문용식 NIA 원장은 “크라우드소싱 기반 데이터 가공인력에 대한 교육 지원을 통해 고품질 데이터 확보, 전문직 일자리 창출 등 인공지능 산업 생태계 조성을 위한 인력 인프라 구축에 도움이 될 것으로 기대된다.”라고 밝혔다.



 












▲ 데이터 라벨링 전문 교육생 모집





해당 AI 학습용 데이터 라벨링 전문 교육 과정은 AI와 데이터 라벨링에서 지켜야 할 AI 윤리 및 개인정보 보안 과정, 데이터 유형별 라벨러 과정, 데이터 전문가 과정, 데이터 고급관리자 과정 등으로 구성되어 있다. 또한, 주요 교육 과정으로는 공통교육(인공지능 윤리, 개인정보 비식별화 등), 데이터 라벨러 과정(이미지, 영상, 음성, 텍스트 입문/기본/심화), 데이터 전문가 과정(라이다(LIDAR) 센서, 데이터 유형별 품질관리 검사 절차 및 방법), 데이터 고급 관리자(PM) 과정(데이터 구축 생애 주기별 프로젝트 관리) 등이 있다.





모든 교육 과정은 무료로 진행되며 8월 24일부터 12월까지 온·오프라인 교육이 병행된다. 해당 프로그램은 ‘인공지능 학습용 데이터 라벨링 전문 교육 신청 사이트(https://aidata.linkedu.co.kr/userLogin.do)’에서 신청할 수 있다. 신청 및 교육 기간 등은 강좌마다 다를 수 있으므로 자세한 정보는 교육 문의처(02-2067-2784)를 통해 문의하길 바란다.





앞서 소개한 프로그램 외에도 다양한 기업이나 기관에서 데이터 라벨링 교육 및 전문인 양성을 위한 프로그램을 진행하고 있으니 참고하는 것이 좋겠다.













 


 


 


 


 


 


 


 


이미지 출처



https://digital.go.kr/front/intro/biInfo.do



https://blog.naver.com/chldmstjr0122/222026432971



https://www.sedaily.com/NewsView/22QBQDLD01



http://www.newsprime.co.kr/news/article/?no=551477



전체 0