Introduction of the Hackathon 대회소개
2020년 인공지능 학습용 데이터 구축(2차) 사업의 일환으로
NHN컨소시엄은 자유대화 음성을 수집 및 가공하여 AI학습데이터를 구축하고 있습니다.
소아와 노인을 포함하여 다양한 연령대의 음성데이터를 수집하여 정제와 가공을 하고 있으며,
이번 경진대회를 통해 데이터를 검증하고 활용을 높이고자 합니다.
대회 개요
- 대회명
- 2020 인공지능 학습용 데이터 해커톤 대회
- 주제
- 다양한 연령대의 음성을 효과적으로 인식할 수 있는 AI 음성인식 알고리즘의 개발
- 참가신청
- ~ 2020. 12. 20 (일)
- 주최/주관
- NHN컨소시엄
- 대상
- AI 음성인식기술을 보유하고 있거나, 음성인식기를 개발하고자 하는 모든 개인 또는 팀 (3인 이하)
※ 대학생 이상 참여 가능합니다.
- 시상
-
총상금 1,500만원
- - 대상(1팀) : 500만원
- - 최우수상(2팀) : 각 300만원
- - 우수상(4팀) : 각 100만원
평가
- 단계
- 수행주체
- 설명
- 1. 학습데이터 배포
- 수행주체 : 주최자
- 참가자가 확정되면 개별적으로 다운로드 방법 안내
※ 배포된 데이터는 해커톤 참가용으로만 활용 가능하며 다른 용도로 사용 및 배포를 금합니다.
- 2. 음성인식알고리즘
개발 및 학습 - 수행주체 : 참가자
- 배포받은 학습데이터를 기반으로 참가자가 개발한 음성인식 학습모델을 이용하여 학습
pretrained 모델 및 외부데이터 사용 가능
- 3. 음성인식 테스트
프로그램 개발 - 수행주체 : 참가자
- 테스트 음성파일을 텍스트 변환하여 정해진 결과양식으로 출력하는 프로그램 개발 및 제출
- 입력 : 디렉토리(테스트 음성파일(.pcm)이 들어있는 폴더, 하위 디렉토리 포함) - 출력 : 결과파일 생성(UTF-8)
파일명1 [탭] 인식결과1
파일명2 [텝] 전사결과2
※ 간단한 알고리즘 특징 및 소개 자료 함께 제출(사용된 오픈소스 및 pretrained모델 명시)
- 4. 테스트
- 수행주체 : 주최자
- 참가자별로 제출한 프로그램을 이용하여 테스트 음성데이터로 음절인식률 측정
※ S/W Spec : 동접 channel 4개로 xRT 1.0 이내로 인식결과 출력이 가능해야 함
※ OS등의 버전 문제로 주최측의 환경에서 정상적으로 구동이 되지 않을 경우 참가자의 하드웨어에서 실행할 수 있도록 환경을 제공해야 함
- 5. 평가
- 수행주체 : 주최자
- 음절 인식률
인식률 = (전체 음절 – ( 삽입 오류 + 삭제 오류 + 대치 오류 )) / 전체 음절

제공 데이터
구분 | 유형 | 화자(명) | 발화수(문장) | 시간(h) | 파일크기(M) |
---|---|---|---|---|---|
학습 데이터 (공개) |
일반 노인 소아 외래어 | 50 50 50 50 | 100,000 100,000 75,000 100,000 | 100 100 75 100 | 12,800 12,800 9,600 12,800 |
합계 | 200 | 375,000 | 375 | 48,000 | |
테스트 데이터 (비공개) |
일반 노인 소아 외래어 | 5 5 5 5 | 1,000 1,000 1,000 1,000 | 5 5 5 5 | 640 640 640 640 |
합계 | 20 | 4,000 | 20 | 2,560 |
수상자 선정 및 시상
시상식: 2021. 01. 29 (금) 예정
대상 (1팀) 500만원
최우수상 (2팀) 300만원
우수상 (4팀) 100만원
Competition Schedule 대회일정
※ 사정에 따라 일정은 변경될 수 있습니다.1. 참가신청 2020. 12. 20(일) 까지
2. 데이터 배포 2020. 12. 21(월) ~ 2020. 12. 23(수)
3. 음성인식기 개발 2020. 12. 24(목) ~ 2021. 01. 15(금)
4. 학습모델 및 음성인식기 제출 2021. 01. 15(금) 까지
5. 평가 2021. 01. 18 (월) ~ 2021. 01. 22 (금)
6. 결과발표 2021. 01. 25 (월)
7. 시상 2021. 01. 29 (금)
Application for Participation 2020 인공지능 학습용 데이터 해커톤 대회
Hackathon 2020 인공지능 학습용 데이터 해커톤 대회
2020 인공지능 학습용 데이터 해커톤 대회 운영사무국TEL : 1588-6362 | E-mail : albacall@incruit.com