Amazon Transcribe POC

2023. 9. 5. 16:42AWS/Amazon Transcribe

728x90
SMALL

- 비용

1분에 0.024 USD // ap-northeast-2 // 오디오 음성 시간 기준

 

- 성능

12분짜리 영상 MP4 to SRT 약 1분 소요

 

- Input

Amazon S3 
MP3, MP4, WAV, FLAC, AMR, OGG, and WebM.

 

- Output

Amazon S3 
SRT, Text, VTT

 

- 대안

Naver CLOVA Note - https://clovanote.naver.com/
Google STT AI - https://cloud.google.com/speech-to-text?hl=ko
OpenAI Whisper - https://platform.openai.com/docs/guides/speech-to-text

 

- 비고

실시간 음성인식도 되지만 성능과 정확도 면에서 떨어지므로 고려 대상은 아님
AWS 생태계내에서 구축하는 거라면 무조건 선택해야 한다.

 

- reference

https://aws.amazon.com/transcribe/
https://aws.amazon.com/ko/blogs/korea/amazon-transcribe-now-supports-speech-to-text-in-korean/
https://www.awsgeek.com/Amazon-Transcribe/

 

- 비교

  비용 (60초) 용량 제한
Amazon
Transcribe
32원 2 GB
OpenAI Whisper 8원 25 MB
Clova Voice 60원 2 GB

 

 

728x90
LIST