Amazon Transcribe POC
2023. 9. 5. 16:42ㆍAWS/Amazon Transcribe
728x90
SMALL
- 비용
1분에 0.024 USD // ap-northeast-2 // 오디오 음성 시간 기준
- 성능
12분짜리 영상 MP4 to SRT 약 1분 소요
- Input
Amazon S3
MP3, MP4, WAV, FLAC, AMR, OGG, and WebM.
- Output
Amazon S3
SRT, Text, VTT
- 대안
Naver CLOVA Note - https://clovanote.naver.com/
Google STT AI - https://cloud.google.com/speech-to-text?hl=ko
OpenAI Whisper - https://platform.openai.com/docs/guides/speech-to-text
- 비고
실시간 음성인식도 되지만 성능과 정확도 면에서 떨어지므로 고려 대상은 아님
AWS 생태계내에서 구축하는 거라면 무조건 선택해야 한다.
- reference
https://aws.amazon.com/transcribe/
https://aws.amazon.com/ko/blogs/korea/amazon-transcribe-now-supports-speech-to-text-in-korean/
https://www.awsgeek.com/Amazon-Transcribe/
- 비교
비용 (60초) | 용량 제한 | |
Amazon Transcribe |
32원 | 2 GB |
OpenAI Whisper | 8원 | 25 MB |
Clova Voice | 60원 | 2 GB |
728x90
LIST