인공지능 AI를 학습시켜 주는 미래유망직업 데이터라벨링에 대해 알아보겠습니다
목차
1.데이터라벨링이란?
2. 라벨링 가공방법
3. 데이터라벨러라는 직업
4. 데이터라벨링 일 시작하기
데이터라벨링이란?
데이터 라벨링의 사전적 의미는 AI는 사람이 사용하는 문서나 사진등의 데이터를 식별할 수 없습니다. 그래서 AI가 스스로 학습할 수 있는 형태로 데이터를 가공해야하는데,이러한 작업을 데이터 라벨링이라고 하고,이 직업을 하는 사람은 데이터 라벨러라고 부르고 있습니다.데이터 라벨링은 아기가 세상을 살아가기 위해서 기본 정보와 상식이 필요하듯 AI에게 여러가지 데이터를 보여주고,주입시켜주고,학습시켜야 합니다.모든 물건들과 생물에 이름을 알려주고 눈이 없는 기계에 2D사진과 데이터를 되도록 많이 넣어줘야하는데요. 사진,문장,영상에 이름을 붙여주고 AI가 학습할수있는 데이터를 만들어 주는것이 데이터 라벨링의 업무입니다.
인공지능이 학습할수 있도록 음성, 텍스트, 이미지 또는 영상데이터에 이름을 붙여주는 가공 작업을 말합니다. 데이터 라벨링 데이터 이노베이션, 데이터 태깅 모두 같은 의미입니다.
라벨링 가공방법
AI가 이미지 또는 영상에서 특정객체를 탐지하기 위해서는 우선 객체에 주석을 다는 작업이 필요합니다.
(블랙올리브 툴로 라벨링 가공하는 방법 )
1.box □(바운딩박스)
물체를 사각형 모양의 박스 안에 포함되도록 그리는 방법입니다. 라벨링 하려는 객체의 범위를 모두 포함시키는 사각형 영역을 생성할 수 있습니다.
2.polygon (폴리곤)
다각형 모양으로 객체의 외곽선을 따라 점을 찍는 방법입니다. 해당 객체의 작업이 완료되면 닫힌 다각형이 형성됩니다.
3.polyline (폴리라인)
연결된 하나의 선, 호를 이용하여 선을 그리는 방법, 객체수의 상관없이 하나의 객체로 인식되며, 다각형 형성되지 않습니다.
4.points (포인트)
점을 생성하는 방법
점을 연속된 위치에 군집으로 생성하더라도 다각형이 형성되지 않습니다.
5.cuboid
2D로 작업할 수 없는 3D객체들을 정육면체로 생성하는 방법
깊이, 넓이, 높이를 계산해서 객체를 어노테이션 합니다.
6.body
몸의 객체를 생성하는 방법
openpose로 추출된 정보를 수정하거나, 신체부위의 검출이 필요할 때 사용합니다.
7.Face
얼굴의 객체를 생성하는 방법
openpose로 추출된 정보를 수정하거나,신체부위 검출이 필요할때 사용합니다.
8.hands
손의 객채를 생성하는 방법
openpose로 추출된 정보를 수정하거나,신체부위 검출이 필요할때 사용합니다.
박스(바운딩)로 대상을 감싸서 이름을 붙이기도 하고 올가미(다각형) 툴(폴리곤)을 이용해서 객체를 감싸서, (스켈레톤) 하나하나 이름을 붙여주기도 합니다.
음성을 듣고 라벨링을 하거나, 움직이는 영상에 바운딩과 태깅을 하는 업무도 있는데 지금 우리나라의 AI의 학습 수준은 중. 고등학생 정도입니다. 그래서 처음엔 이렇게 생긴 건 고양이고 이렇게 생긴건 강아지고 이건 악어고 이건 자동차야 이렇게 알려주었다 업무가 이제는 이건 사람의 손이고 관절은 이렇게 움직인다, 이건 차고 이건 신호등이다, 2D로 보면 이렇고 3D로 보면 이렇다는 수준으로 올라가고 있다고 보면 됩니다. 그래서 초기 라벨링에 비해 데이터 라벨링은 앞으로 계속 난이도가 올라갈 것 같습니다. 여러 가지 라벨링 방식을 섞은 복합 라벨링도 늘 것 같고 AI산업 자체가 이제 막 움트기 시작했고 아직 시장에 상용화된 서비스가 별로 없기 때문에 데이터 라벨링이 필요한 업무는 무궁무진 할 것이라 생각하고 있습니다.
데이터라벨러라는 직업
이제 정식으로 한국직업사전에도 등록되어 있는 신 직군입니다. 데이터 라벨러는 세금 3.3% 납부하고 종합소득세 신고를 하는 프리랜서 형태로 활동을 하는 것이고 또한 국가에서 진행하는 큰 프로젝트가 대부분 하반기에 몰려있다 보니 데이터 라벨러로 활동하는 프리랜서분들은 국내에 데이터라벨링 일감을 주는 어플과 잡코리아, 알바몬, 사람인에서 늘 일감을 착아야합니다. 더 질이 좋은 일감, 체계적인 업체와 업무, 단가가 높은 데이터라벨링 일감으로 갈아타기도 하고 나에게 맞는 내가 잘할 수 있고 많은 수익을 낼 수 있는 업무를 찾는 지속적으로 노력도 필요합니다.
데이터라벨링 일 시작하기
1. 데이터라벨링 일감을 주는 어플/사이트에서 시작해 보기
데이터라벨러들은 열 군데가 넘는 데이터라벨링 어플에 가입이 되어있고 일감이 있는지 수시로 확인합니다. 각각의 어플들은 그 어플만의 데이터 라벨러를 육성하고 관리하는 기준이 있습니다.
크라우드웍스, 테스트웍스는 교육과정을 내일 배움 카드를 통해 무료로 교육을 제공하기도 하고 자격증을 만들어 등록해서 교육을 얼마나 받았는지, 자격증이 있는지 없는지에 따라 지원할 수 있는 일감을 다르게 제공하기도 합니다. 또한 어떤 사이트는 간단한 체험을 완수하면 바로 일감지원이 가능한 곳도 있습니다. 또 어떤 곳은 핸드폰으로 할 수 있는 일감을 주로 주는 곳, 사진위주, 음성위주, 어려운 작업위주로 일감을 주는 곳도 있습니다. 다양한 곳들이 있으니 각자 취향에 맞게 선택해서 가입하고 활동을 시작하면 됩니다. 교육과 자격증은 필수가 아니고 선택사항입니다. 업체에서 인력을 뽑는 기준은 아니지만 그래도 선호하는 부분이 교육을 받고 자격증을 딴 인력이 일을 했을 때 반려가 적고 작업 품질이 좋기 때문에 교육받기를 권장합니다. 일감이 많고 난도가 높지 않은 일감의 경우에는 전체 오픈으로 작업자를 구인하는 경우도 많이 있습니다.
구직사이트
1.NIA
한국지능정보사회진흥원
-대한민국의 디지털 전력을 지원하기 위한 디지털 플랫폼을 담당하고 있는 기관입니다. NIA에서 진행하는 여러 데이터 라벨링 업무는 보안을 중요시하고 대규모 프로젝트로 진행하는 일이 대부분이기 때문에 성수기 때 구직사이트에 들어가면 NIA의 일감이 많이 올라와 있는 것을 쉽게 확인할 수 있습니다. 주로 NIA의 프로젝트를 교육하고 수료증을 발급해 주며 크라우드워커로 성장할 수 있도록 하는 것이 AI-Hub ai데이터사이트입니다.
크라우드웍스와 테스트웍스만 내일 배움 카드 교육과정을 제공하고 있어 교육과정을 꼭 들어야 일을 할 수 있다고 생각하시는 분들이 많은데 물론 아예 모르고 시작하는 것보다는 교육과정을 듣고 시작하면 AI산업에 대해 조금은 이해하기 쉬우며 테이터라벨링의 큰 틀을 이해하는데 도움이 될 것입니다. 하지만 일이 있고 채용만 된다면 바로 시작할 수 있는 일입니다.
댓글