학술 논문은 재미있게 읽을 수 있는 것이 아닙니다. 보통 사람에게는 촘촘하고 길고 분야별 언어로 가득 찬 논문이 들어가기에 상당히 위협적일 수 있습니다. 이는 일반적으로 의지력을 테스트하기 위해 설계된 것처럼 보이는 PDF로 패키지됩니다. 워싱턴 대학교 연구원 그룹은 일반 사람들 앞에서 해당 작업을 수행할 수 있는 더 좋은 방법이 있을 수 있다고 생각합니다. 그들은 신문을 짧은 영상으로 바꾸고 있습니다.
PaperTok이라고 하는 이 도구는 AI를 사용하여 연구자가 학술 논문을 짧고 사회 친화적인 동영상으로 변환할 수 있도록 돕습니다. 두뇌를 썩게 만드는 콘텐츠를 공유하는 대신 연구를 설명하는 아이디어를 제외하고 TikTok을 생각해 보세요. 가장 좋은 부분은? 페이퍼톡은 단순히 AI를 사용해 논문을 요약하는 것이 아니라, 그 과정에 참여하는 과학자와 연구자를 중심으로 플랫폼을 구축하고 있습니다.
PaperTok 작동 방식

연구원이 Google Gemini를 사용하여 문서를 분석하고 짧은 동영상 아이디어를 생성하는 PaperTok에 논문을 업로드합니다. 짧은 형식의 비디오가 처음 몇 초 안에 라이브되거나 죽기 때문에 시스템은 여러 가지 후크를 제공합니다. 사용자가 후크를 선택하면 PaperTok은 스크립트를 생성합니다. 그런 다음 연구원은 스토리보드 단계로 이동하기 전에 대본을 편집하고, 톤을 조정하고, 비디오를 다듬을 수 있습니다. 그런 다음 시스템은 스크립트를 장면으로 나누고 한 번에 한 섹션씩 시각적 클립을 생성합니다.
PaperTok은 비디오가 준비된 후 논문 작성자와 비디오 제작자에 대한 크레딧을 추가하므로 AI가 실제로 작업을 수행한 사람들로부터 빼앗기지 않도록 보장합니다. 영상은 짧게 제작되었습니다. PaperTok은 연구 논문을 45초 길이의 비디오로 변환할 수 있는데, 이는 많은 사람들이 실제로 온라인에서 미디어를 소비하는 방식과 훨씬 더 가깝습니다.
AI가 AI와 싸우는 데 어떻게 사용되는지
PaperTok은 사람들이 이미 짧은 과학 비디오를 만들기 위해 생성 AI를 사용하고 있다는 사실을 연구자들이 발견했기 때문에 존재합니다. 하지만 비전문가가 AI를 활용해 복잡한 서류를 설명하는 경우 잘못된 정보가 빠르게 퍼지는 실수를 저지르는 경우가 많다. 따라서 PaperTok은 도구를 올바른 방식으로 사용하고 과학자들에게 최신 정보를 제공하고 있습니다.

테스트에서 UW 연구자들은 100명의 온라인 참가자와 18명의 학술 참가자의 피드백을 사용하여 PaperTok 비디오를 다른 두 PDF-비디오 생성기의 비디오와 비교했습니다. PaperTok의 동영상은 사용하기 쉽고 매력적이라는 평가를 받았습니다. 일부 사용자는 여전히 동영상이 이상한 시각적 인공물이나 말도 안되는 텍스트와 같은 문제로 인해 AI로 생성된 것처럼 보인다고 느꼈습니다. 그래서 기술은 아직 완벽하지 않습니다. 동영상이 너무 명백하게 AI가 만든 것처럼 보이면 신뢰성이 손상될 수도 있습니다.
현재 PaperTok은 유료 Google Gemini 구독 사용자에게만 제공됩니다. 또한 팀은 생성된 장면의 특정 부분을 사용자가 보다 직접적으로 안내할 수 있는 방법을 포함하여 사용자 정의를 개선할 계획입니다.
이 주제에 대해 더 알고 싶다면 아래를 참고하세요