[TED] Massive Online Collaboration

글쓴이
UMakeMeHigh
등록일
2011-12-10 07:28
조회
4,604회
추천
1건
댓글
5건
http://www.ted.com/talks/luis_von_ahn_massive_scale_online_collaboration.html

오랜만에 TED에 들어가봤더니, 재미있는 동영상이 있네요..

간단히 요약하자면,

구글같은 온라인 사이트 가입하거나 파일 다운로드 받을 때,
프로그램에 의한 남용을 막기 위해 사람임을 확인하는 절차가 있습니다.
컴퓨터가 인식 불가능한 이미지의 글자를 그대로 입력함으로서 인간임을 증명을 하는 것이죠.
(솔직히 귀찮기는 하지만 필요한 것이려니 하고 순순히 입력해 왔었죠.)

프리젠터는 그걸 발명한 사람인데,
그 기능으로 하루에 인류가 소비하는 시간이 엄청나다는 것을 알게 되서 ( 하루 2억건 X 건당 10초)
비효율적이라는 것을 느끼고.. 도서관의 책들을 전자화 하는 일에 주목하게 됩니다.

오래된 책들은 바래고 글자가 흐려서 글자인식프로그램을 통한 인식률이 높지 않은데..
그걸 사람을 써서 전자화 하는 일은 막대한 돈이 들게 되겠지요. 그런데 글자인식이 불가능한
단어들을 위의 기능(사람임을 필터링하는)을 이용하면, 정말 돈 들이지 않고, 막대한 정보를 얻을 수 있는 일석2조의 효과가 납니다.

여기게 그치지 않고, 웹페이지를 여러 언어로 번역하는 일도 대중의 힘을 빌리게 됩니다.
(위키 스페인어 버전의 양은 영어 버전의 20% 정도라고 합니다)
언어 공부 사이트를 만들어서, 처음에는 단어를 해석하는 식으로 공부를 하는 학생이
레벨이 오르면 문장을 해석하게 하고, 그런 여러 사람의 해석을 모아서 전체 웹페이지를 다른 언어로
완성한다는 아이디어 인데요..

이 동영상을 보자마자 그 기발함에 무릎을 치게 되었습니다. 이것이 진짜 비지니스 모델이구나 싶네요.
동영상을 전체 보시면, 이런 비전문가 집단의 오입력을 막기 위한 장치도 있고, 이런 저런 흥미있는
내용이 많이 있습니다.
 
  • 아나로그의추억 ()

      재미있는 비디오입니다. 기술이 새로운 비즈니스를 만드는 핵심적인 자원이라는 것을 이해할 수 있습니다.

    관심있는 분들은 비즈니스위크 기사,

    <a href=http://www.businessweek.com/innovate/content/nov2008/id2008113_656340.htm target=_blank>http://www.businessweek.com/innovate/content/nov2008/id2008113_656340.htm</a>
     
    과학재단 특별 리포트를 읽어보시기 바랍니다.
    <a href=http://www.nsf.gov/news/special_reports/voices/luis_von_ahn.jsp target=_blank>http://www.nsf.gov/news/special_reports/voices/luis_von_ahn.jsp</a>

  • feeling ()

      첨에 무슨 말인지 이해를 못했는데, 이거군요.
    무의미한 글자들 똑같이 타이핑하는 것으로 인증절차로 하지 말고,
    번역이 필요한 고서등의 자료를 잘게 나눠서
    번역+타이핑하는걸로 인증절차를 대체해보자는 거죠?
    실효성이 있을지는 모르겠네요.. 사람마다 변역하는 방법도
    다 다르고 용어도 번역하는 방법이 다를 수 있어서
    중구난방 무슨 말 뜻인지 이해 못하는 상황이 올 수도....

  • UMakeMeHigh ()

      feeling//

    제가 기억에 의존해서 쓰다보니 좀 맥락이 섞여서 해석되게 쓴 모양입니다.
    두 개는 다른 프로젝트에요
    - 인간 인증을 무의미한 글자 따라치게 하는 것이 아니라 책 스캔시
      컴터가 해석못하는 단어를 입력하게 하는 것
    - 웹페이지 번역을 외국어 공부사이트를 이용해서 대중을 이용하는 것

    시뮬레이션 해 본 결과 승산이 있다고 본 모양입니다. 실제 전문 번역가의 번역도 포함시키고. 여러 사람의 번역을 모아서 만들면
    높은 수준의 번역은 아니더라도 맥락은 이해할 만한 수준은 되지 않을까 싶숩니다. 번역기 돌리는 것보다는 수준이 높다고 생각하는 것 같습니다.

  • Za쿠라 ()

      UMakeMeHigh//

    두번째는 웹페이지 같은 인터페이스 구축이 문제인것 같군요.

     첫번째는 궁금한것이 실제로 타이핑 하는 것이 사람인 것을 어떻게 확인하나요? 그러니까 예를 들어 희미하게 'feel' 이라고 보이는 것을 peel이라고 써도 컴퓨터는 그것을 검증하지 못하지 않나요?

  • UMakeMeHigh ()

      영상에 따르면 사용자는 두 개의 단어를 따라서 입력하도록 요구받는데
    한 단어는 기존 DB에 저장된 것으로 입력한 값이 맞게 입력되었는지 검증이 가능한 것이고
    또 다른 한 단어가 컴퓨터가 인식 못하는 값이죠..

    두 단어중 어느 단어가 기존에 등록된 값인지는 입력자는 모르므로
    사용자는 두 단어 모두 되도록 그대로 적으려고 노력하겠죠.

    시뮬레이션 해 본 결과 이방식으로도 입력 결과가 믿을만하다고 생각하는거 같기는 한데..
    추가적으로 제 의견을 덧붙이면

    애초에 컴터가 인식 못하는 글자이므로 컴퓨터 자체는 입력받은
    값을 검증할 방법이 없습니다.

    대신에 사람의 집단지성의 모집단을 늘리면 신뢰성이 높아지리라 봅니다.
    동일 단어를 여러 사람이 입력하도록 해서, 예를 들면 같은 단어를
    10명이 입력하게 하여 7명 이상이 동일하게 입력하였다면...
    맞는 입력값으로 간주하고, 70%가 넘는 답이 안나온다거나 하면... 그런 것들을 모아서
    전문가가 입력하도록 한다면... 보완이 되지 않을까요?

     



펀글토론방

게시판 리스트
번호 제목 글쓴이 등록일 조회 추천
7339 [재토론] 통일 그리고 과학기술인 댓글 1 BizEng 12-20 4498 0
7338 동지섣달 꽃 본 듯이 날 좀 보소~ (세시풍속과 24절기) 블랙빈 12-13 4334 0
열람중 [TED] Massive Online Collaboration 댓글 5 UMakeMeHigh 12-10 4605 1
7336 LG전자 “우리 휴대폰 안쓰면 출입금지” 댓글 7 몽상가 12-07 5168 0
7335 (비즈니스 바로읽기) 잡스 따라하기. 장사꾼들의 농간 ? 아나로그의추억 12-07 3947 0
7334 대학생 비판 댓글 11 몽상가 12-04 6007 0
7333 이민화 고산 대담: "기술 창업의 기회가 왔다” 댓글 42 아나로그의추억 11-29 6587 0
7332 日 오키나와서도 세슘 검출 댓글 1 탑돌이 11-26 7267 0
7331 12월 13일 대한민국과학기술대연합 출범 댓글 1 파랑개비 11-22 4308 0
7330 최중경 (전) 장관은 과학기술인과 혁신형 창업가에 대한 폄훼를 즉각 중단하라. 댓글 13 BizEng 11-19 11705 7
7329 흥미진진한 번역 배틀..^^ 댓글 6 칼도 11-14 6145 0
7328 What is a PhD ? 댓글 7 Simon 11-10 4949 0
7327 '월 100만원'...값싼 중국 개발자 몰려온다 댓글 2 Wentworth 11-09 4581 0
7326 88만원 세대 차라리 깽판을 쳐라 댓글 7 몽상가 11-07 5407 0
7325 청년백수문제 해결을 위해 아오지 탄광으로 보낸다 ???? 댓글 12 닥다리더 10-31 5293 0
7324 무서운 애플 시리...구글 뒤집을 핵폭탄 댓글 8 Wentworth 10-22 6161 0
7323 교과부의 도 넘은 과학기술 '홀대' 댓글 3 남영우 10-17 7771 0
7322 (비즈니스 바로 읽기)마크 앤더슨="소프트웨어가 세상을 먹어 치운다 ?" 아나로그의추억 10-16 9195 0
7321 C언어 창시자 데니스 리치 사망 댓글 2 로이드 10-13 5226 0
7320 (디지털 바로읽기)스티브 잡스 댓글 4 아나로그의추억 10-11 4820 0


랜덤글로 점프
과학기술인이 한국의 미래를 만듭니다.
© 2002 - 2015 scieng.net
모바일 버전으로 보기