상단으로

Introduction of the Hackathon 대회소개

2020년 인공지능 학습용 데이터 구축(2차) 사업의 일환으로
NHN컨소시엄은 자유대화 음성을 수집 및 가공하여 AI학습데이터를 구축하고 있습니다.
소아와 노인을 포함하여 다양한 연령대의 음성데이터를 수집하여 정제와 가공을 하고 있으며,
이번 경진대회를 통해 데이터를 검증하고 활용을 높이고자 합니다.

대회 개요
대회명
2020 인공지능 학습용 데이터 해커톤 대회
주제
다양한 연령대의 음성을 효과적으로 인식할 수 있는 AI 음성인식 알고리즘의 개발
참가신청
~ 2020. 12. 20 (일)
주최/주관
NHN컨소시엄 NHN NHN다이퀘스트 NHN에듀 EBS 셀바스AI 잉글리시헌트 원더풀플랫폼 아임클라우드 크라우드웍스
대상
AI 음성인식기술을 보유하고 있거나, 음성인식기를 개발하고자 하는 모든 개인 또는 팀 (3인 이하)
※ 대학생 이상 참여 가능합니다.
시상
총상금 1,500만원
  • - 대상(1팀) : 500만원
  • - 최우수상(2팀) : 각 300만원
  • - 우수상(4팀) : 각 100만원
평가
  • 단계
  • 수행주체
  • 설명
  • 1. 학습데이터 배포
  • 수행주체 : 주최자
  • 참가자가 확정되면 개별적으로 다운로드 방법 안내

    ※ 배포된 데이터는 해커톤 참가용으로만 활용 가능하며 다른 용도로 사용 및 배포를 금합니다.
  • 2. 음성인식알고리즘
    개발 및 학습
  • 수행주체 : 참가자
  • 배포받은 학습데이터를 기반으로 참가자가 개발한 음성인식 학습모델을 이용하여 학습
    pretrained 모델 및 외부데이터 사용 가능
  • 3. 음성인식 테스트
    프로그램 개발
  • 수행주체 : 참가자
  • 테스트 음성파일을 텍스트 변환하여 정해진 결과양식으로 출력하는 프로그램 개발 및 제출
    - 입력 : 디렉토리(테스트 음성파일(.pcm)이 들어있는 폴더, 하위 디렉토리 포함) - 출력 : 결과파일 생성(UTF-8)
    파일명1 [탭] 인식결과1
    파일명2 [텝] 전사결과2

    ※ 간단한 알고리즘 특징 및 소개 자료 함께 제출(사용된 오픈소스 및 pretrained모델 명시)
  • 4. 테스트
  • 수행주체 : 주최자
  • 참가자별로 제출한 프로그램을 이용하여 테스트 음성데이터로 음절인식률 측정

    ※ S/W Spec : 동접 channel 4개로 xRT 1.0 이내로 인식결과 출력이 가능해야 함
    ※ OS등의 버전 문제로 주최측의 환경에서 정상적으로 구동이 되지 않을 경우 참가자의 하드웨어에서 실행할 수 있도록 환경을 제공해야 함
  • 5. 평가
  • 수행주체 : 주최자
  • 음절 인식률
    인식률 = (전체 음절 – ( 삽입 오류 + 삭제 오류 + 대치 오류 )) / 전체 음절
제공 데이터
구분 유형 화자(명) 발화수(문장) 시간(h) 파일크기(M)
학습 데이터
(공개)
일반 노인 소아 외래어 50 50 50 50 100,000 100,000 75,000 100,000 100 100 75 100 12,800 12,800 9,600 12,800
합계 200 375,000 375 48,000
테스트 데이터
(비공개)
일반 노인 소아 외래어 5 5 5 5 1,000 1,000 1,000 1,000 5 5 5 5 640 640 640 640
합계 20 4,000 20 2,560
수상자 선정 및 시상 시상식: 2021. 01. 29 (금) 예정
  • 대상 (1팀) 500만원

  • 최우수상 (2팀) 300만원

  • 우수상 (4팀) 100만원

Competition Schedule 대회일정

※ 사정에 따라 일정은 변경될 수 있습니다.
  • 1. 참가신청 2020. 12. 20(일) 까지

  • 2. 데이터 배포 2020. 12. 21(월) ~ 2020. 12. 23(수)

  • 3. 음성인식기 개발 2020. 12. 24(목) ~ 2021. 01. 15(금)

  • 4. 학습모델 및 음성인식기 제출 2021. 01. 15(금) 까지

  • 5. 평가 2021. 01. 18 (월) ~ 2021. 01. 22 (금)

  • 6. 결과발표 2021. 01. 25 (월)

  • 7. 시상 2021. 01. 29 (금)

Application for Participation 2020 인공지능 학습용 데이터 해커톤 대회

Hackathon 2020 인공지능 학습용 데이터 해커톤 대회

2020 인공지능 학습용 데이터 해커톤 대회 운영사무국
TEL : 1588-6362 | E-mail : albacall@incruit.com
  • ㈜엔에이치엔다이퀘스트 NHN diquest Inc. |오시는 길 (우:08390) 서울시 구로구 디지털로 30길 31 (구로동, 코오롱빌란트2차) 5층 5th FL., Kolonbillant II, Digital 30 Avenue 31, Guro-gu, Seoul, 08390
  • TEL 02-3470-4300
  • FAX 02-3470-4301
  • E-mail web@diquest.com