THE BEST Competitions
Competitions
데이터 경연대회는 많은 기능을 합니다.
모범 사례를 배우고, 작업에 대한 피드백을 받고, 기술을 향상 할 수 있는 훌륭한 기회이며
문제에 대한 솔루션을 크우드소싱하여 다양한 아이디어를 얻는 방법이 되기도 합니다.
학생 또는 직장인 모두에게 다양한 데이터 관련 분야에 종사하는 최고의 인재들 사이에서 자신의 한계를 넘어서고 창의성을 키우는 기회가 될 수 있습니다.
(직장인의 경우 주어진 업무와 하고자 하는 일의 괴리가 있다면, 이러한 대회를 통해 욕구를 해소할 수 있습니다. ^^)
이에 도전해 볼 만한 다양한 데이터 경연 대회 8가지를 소개 하고자 합니다.
1. Iron Viz
- 웹 사이트: tableau.com/ko-kr/iron-viz
- 주최: Tableau
- 매년 Tableau Public은 최고의 비주얼리제이션 대회인 Iron Viz의 준비 과정으로 여러 데이터 시각화 콘테스트를 주최합니다.
- 이 가상 ‘예선’ 콘테스트는 연중 개최되며, 각 예선마다 데이터 시각화 기술을 부각시킬 특정 주제가 주어집니다.
- 이 콘테스트의 각 우승자는 Tableau Conference 또는 Tableau Conference Europe에서 열리는 최종 결선에서 17,000명의 청중 앞에서 실시간으로 경쟁을 벌이게 됩니다.
- 최종 결선에서는 세 명의 콘테스트 우승자가 같은 데이터 집합을 사용하여 데이터 시각화를 생성하여 겨루게 됩니다.
- Iron Viz 참가자는 비주얼리제이션의 전반적인 디자인, 비주얼리제이션 및 데이터가 스토리를 얼마나 잘 표현하는지, 데이터 및 결과에 대한 분석이 얼마나 심도 있는지 등 몇 가지 기준으로 심사를 받게 됩니다.
- 우승 여부를 떠나서, Iron Viz 콘테스트는 분석 업계에 진출하고 업계의 동료 및 전문가들로부터 피드백을 받을 수 있는 좋은 기회가 될 것입니다.
2. Kaggle Competitions
- 웹 사이트: kaggle.com/competitions
- 주최: Kaggle
- Kaggle은 데이터 경연 대회 목록에서 빼놓을 수 없는 대회입니다.
- Kaggle은 데이터 과학 경연 대회에서 가장 잘 알려진 플랫폼 중 하나입니다.
- 이 사이트는 현재의 명성을 얻게 해준 기계 학습 경연으로 시작되었습니다.
- Kaggle 경연 대회에는 꾸준히 수천 명에 이르는 참가자들이 팀 또는 개인 자격으로 매력적인 상품을 놓고 경쟁을 벌입니다.
- 이 대회는 복잡한 문제를 제시하고, 참가자들이 그 문제를 해결할 최고의 알고리즘을 고안해내는 것을 특징으로 합니다.
- 상품은 지적인 만족감에서부터 '기념품', 금전적 보상에 이르기까지 다양합니다.
- 대부분의 금전적인 보상은 몇 만 달러 범위 내이지만 10만 달러를 넘는 상금도 있었습니다.
- 지금까지 최고의 단일 상금은 1백만 달러로, 부동산 회사인 Zillow의 주택 가격을 예측하는 'Zestimate' 벤치마크 모델을 뛰어넘는 1위 작품에 수여되었습니다.
- Kaggle은 여러 조직을 위한 경연 대회를 개최했을 뿐만 아니라, 과학을 통해 더 나은 사회를 만들고자 매년 Data Science Bowl 경연 대회도 개최하고 있습니다.
3. Kantar Information is Beautiful Awards
- 웹 사이트: informationisbeautifulawards.com
- 주최: Information is Beautiful과 Kantar
- 어떤 식으로든 데이터 시각화를 접해 보았다면, 시각적 디자인이 정보의 전송을 어떻게 증대시키는지 보여주는 David McCandless의 사이트,
- 'Information Is Beautiful'에 대해 들어봤을 것입니다.
- 이 사이트에서는 또한 가장 뛰어나고 창의적인 데이터 시각화에 대한 사람들의 관심을 끌기 위해 Information is Beautiful Awards를 수여하고 있습니다.
- 이 상은 매년, 데이터를 얼마나 잘 배열하는지, 주제에 맞게 얼마나 잘 정보를 강조하고 인사이트를 끌어내는지를 평가하여 데이터를 가장 탁월하게 예술적으로 변환시키는 사람에게 수여되고 있습니다.
- 이 콘테스트는 Information is Beautiful Awards 시상식으로 대미를 장식하는데, 전체 참가자 목록은 사이트에 소개되며, 수상자로 선정된 참가자들은 연말 시상식에 참석합니다.
- 2018년 시상식에서 선정된 참가자들은 자신의 비주얼리제이션이 식장의 쿠키에 새겨진 것을 보았습니다.
4. Driven Data Competitions
- 웹 사이트: drivendata.org/competitions
- 주최: Driven Data
- Kaggle과 마찬가지로 Driven Data 역시 어려운 예측 문제에 대한 솔루션을 크라우드소싱할 목적으로 데이터 과학 경연 대회를 열고 있습니다.
- 이들은 통계 모델을 구축함으로써 예측을 돕고 이 세상의 외면할 수 없는 사회 문제를 해결하고자 노력하고 있습니다.
- 비록 그 규모는 Kaggle만큼 크지는 않지만 Driven Data는 우리 사회에 실질적인 영향을 미치는 문제들을 해결하는 데 주력함으로써 인간과 자연 모두를 이롭게 합니다.
- 그 중 특히 이목을 끄는 경연 대회로는 AARP Foundation이 후원하는 고령자의 신체적인 안전을 예측하기 위한 경연 대회와 동영상을 통해 물고기 크기를 측정하고 그 수를 세어서 지속 가능한 어업을 지원하기 위한 경연 대회(The Nature Conservancy and Gulf of Maine Research Institute가 후원)가 있습니다.
- 참가자들은 현재 데이터의 실제 값을 기준점로 삼아 비교함으로써, 문제 해결을 위해 데이터를 얼마나 잘 예측할 수 있는가에 입각하여 평가됩니다.
- 우승한 모델은 목표를 더 잘 개선할 목적으로 주최측 조직에 통합됩니다. 어떤 경연 대회는 자부심을 가질 권리를, 어떤 경연 대회는 금전적인 보상을 제공하지만, 모두 세상에 영향력을 발휘한다는 공통점이 있습니다.
5. Crowd ANALYTIX Community
- 웹 사이트: crowdanalytix.com/community
- 주최: CrowdANALYTIX
- CrowdANALYTIX도 역시 데이터 모델링 경연 대회를 여는데, 기계 학습, 인공 지능, 딥러닝, 자연어 처리를 주요 분야로 다룹니다.
- 이 경연 대회는 격식을 차리는 대회는 아니지만, 결코 보상이 적지는 않습니다. 여기에서 언급한 다른 경연 대회와 마찬가지로, 어떤 경연은 순수하게 학습을 목적으로 하고 어떤 경연에는 상금이 걸려 있습니다.
- 이 플랫폼은 두 가지 '계층'으로 구성되어 있는데, 하나는 봇이라는 컴퓨터 계층이고 다른 하나는 이러한 봇과 알고리즘을 구축하는 데이터 과학자들이라는 인간 계층입니다.
- 이 경연 대회의 데이터 경연작들은 다른 대회와 달리 일관적인 반복을 위해 일종의 진행 중인 작업으로 간주됩니다.
- 우승을 차지하는 알고리즘은 CrowdANALYTIX의 데이터베이스로 이동된 다음 세부 조정을 위해 모니터링됩니다.
- 이 알고리즘의 성능이 저하되기 시작하면 커뮤니티로 다시 반환되어 조정되거나 다시 구축됩니다.
6. Coda Lab Competitions
- 웹 사이트: competitions.codalab.org
- 주최: Coda Lab
- Coda Lab은 전산 연구를 위한 오픈 소스 플랫폼입니다.
- 본 경연 대회는 공동 연구 및 코드 테스트를 위해 개최됩니다.
- 권위있는 상을 수여하지는 않지만, 함께 협력하여 보다 효율적이고 재생산 가능한 코드를 생성한다는 의의가 있습니다.
- Coda Lab은 데이터의 프로그래밍 및 코드 구축에 중점을 두고 있으며, 공동 프로젝트 및 과제 진행 경험을 쌓는 좋은 방법이 될 수 있습니다.
7. Topcoder Open
- 웹 사이트: tco19.topcoder.com
- 주최: Topcoder
- Topcoder는 코드 테스팅과 연구를 함께 진행하는 공동의 노력이라는 점에서 Coda Lab과 유사합니다.
- 메인 사이트에 데이터 과학에서부터 코딩, 웹 디자인에 이르는 광범위한 도전 과제와 경연 대회를 제시하고 있습니다.
- 많은 경우에 상당한 상품을 제공하지만 어떤 경연은 순수하게 도전하는 데 의미를 둡니다.
- 가장 중요한 경연은 매년 열리는 '최고의 프로그래밍 및 디자인 토너먼트'라고 하는 Topcoder Open입니다.
- 알고리즘, 개발, UI 디자인, 품질 보증과 같은 다양한 경쟁 항목으로 구성되어 있습니다. 첫 경연은 온라인으로 열리며, 여기서 우승자들은 점수에 따라 추가적인 상품을 받고, 미국에서 열리는 TCO 결승전에 초대됩니다.
- TCO는 더 많은 사람들이 경연에 참가할 수 있도록 더 작은 규모의 지역 이벤트도 개최하고 있습니다.
- 이러한 이벤트의 기간은 1~2일에 불과하지만 더 많은 나라에 기회를 제공합니다.
- 먼저 Tableau Public에서 무료로 계정을 만들고 리소스 페이지에 게시되어 있는 데이터 집합 중 하나를 사용하여 직접 데이터 시각화를 만들어보십시오.
- 팁: 연습이 필요하시다면, Makeover Monday를 시도해 보십시오.
- 일요일마다 새로운 데이터 집합이 게시되며, 전 세계 사람들이 데이터 시각화를 만들어서 그 주 수요일에 웹 세미나를 통해 이에 대해 토론하는 곳입니다.
- 이미지 분류가 해결 된 문제라고 생각하고 싶을 수 있습니다.
- 그러나 훈련 데이터가 제한되고 카테고리가 매우 유사한 도메인에서 기존 기술의 성능이 좋지 않은지 살펴보면 그렇지 않은지 확인할 수 있습니다.
- 특히 세분화 된 분류, 시각적으로 유사한 식물 또는 동물 종 간의 정확한 구별, 망막 질환, 건축 양식 등은 인간과 기계 성능의 한계를 밀어 붙이는 매우 어려운 문제입니다.
출처: https://www.tableau.com/ko-kr/about/blog/2019/3/7-data-competitions-data-scientists-and-analysts-104111
데이터 셋: https://en.wikipedia.org/wiki/List_of_datasets_for_machine-learning_research
Comments
Post a Comment