영상 데이터의 정보를 어떻게 하면 가져와 정보를 수집할 수 있을까 하는 생각이 있었습니다. 그러다 OpenAI의 Whisper를 접했고 쉽게 사용할 수 있는 방법이 있어 이를 기술하고자 합니다. Whisper는 ChatGPT로 유명한 OpenAI의 자동 음성 인식(ASR) 시스템입니다. 음성 정보를 넣으면 언어를 인식하고, 다른 언어를 자동으로 영문으로 번역까지 해 올 수 있습니다. YouTube 영상의 url을 넣었을 때 해당 영상을 다운 받고, Whisper를 통해 인식하여 텍스트로 가져오고, 한글로 번역하는 과정까지 작성해 보도록 하겠습니다. 먼저 사용할 python Package들을 다운받아 줍니다. YouTube Download를 위해 pytube, ASR을 위해 whisper를 다운받아 줍니다..