음성·영상 받아쓰기NEW

들리는 모든 것을,
받아 적습니다

한국어 특화 AI가 음성을 받아쓰고 화자까지 구분해요.
최대 4시간·2GB 파일, 18개 언어 지원.

핵심 특징

정확하게,
그리고 빠르게

한국어 특화 STT 엔진으로 정확하게 받아 적고, 화자까지 자동으로 구분합니다.
회의·인터뷰·강의 무엇이든 한 번에 끝.

한국어 특화 AI 받아쓰기

한국어에 최적화된 STT 엔진. 한+영 혼합 음성도 코드 스위칭으로 정확히 인식합니다.

화자 자동 구분

여러 명이 대화하는 음성을 [화자 1] [화자 2]로 자동 분리. 회의록·인터뷰에 최적.

긴 파일도 한 번에

최대 4시간 · 2GB까지 한 번에 처리. 1시간 회의도 끊김 없이 받아 적어요.

검수자 옵션

방송·납품급이 필요할 땐 전문 검수자가 직접 듣고 수정합니다.

4단 가격

필요한 만큼만,
분 단위 정산

받아쓰기만 할지, 번역까지 할지, 검수를 받을지 — 네 가지에서 골라요.
분 단위로 정확하게 청구됩니다.

AI · 받아쓰기만
300원/분
10분 = 3,000원
원어 그대로 받아쓰기.
TXT 또는 SRT 다운로드
AI · 받아쓰기 + 번역
1,000원/분
10분 = 10,000원
받아쓰기를 12개 언어로
한 번에 번역
검수 · 받아쓰기만
3,000원/분
10분 = 30,000원
전문가가 직접 듣고
수정한 받아쓰기 결과
모든 가격은 분 단위 정산이에요. 1분 미만은 1분으로 계산돼요.
사용 사례

이런 분들이
가장 많이 써요

받아쓰기 한 번이 회의록·인터뷰·자막으로 바로 이어집니다.

Use case 01

회의록 자동 생성

팀 회의·고객사 미팅을 녹음만 해두면, 끝나자마자 받아쓰기 문서가 나옵니다. 다국적 회의는 번역까지 한 번에.

Use case 02

인터뷰 받아쓰기

기자·연구원·콘텐츠 제작자의 필수 작업. 1시간 인터뷰를 몇 분 안에 텍스트로 변환해 바로 편집할 수 있어요.

Use case 03

강의·강연 자막

SRT 포맷으로 다운로드해 영상 편집기에 바로 얹으세요. 강의 영상에 자막 다는 작업이 한결 가벼워집니다.

지원 포맷

음성·영상 모두
받아 적습니다

대부분의 음성·영상 파일을 그대로 올려주세요.
영상은 내부에서 자동으로 오디오를 추출합니다.

음성 파일
MP3 WAV M4A AAC FLAC OGG
영상 파일
MP4 MOV MKV WEBM AVI
다운로드
TXT (받아쓰기) SRT (자막)
받아쓰기 언어
18개 언어 한+영 혼합 (코드 스위칭) KO · EN · JA · ZH · DE · FR · ES · IT · RU · VI 외
번역 언어
12개 언어 EN · JA · ZH · VI · TH 외
최대 파일
2 GB 4시간
Live Preview

실제로는 이렇게
동작합니다

음성에서 자막까지,
한 번의 업로드로 끝납니다.

음성 받아쓰기 + 번역
interview_2026_05_15.mp3 → SRT (KO · EN)
화자 흐름과 시간 코드를 그대로 살린 자막. 들리는 그대로 받아 적고, 같은 타임코드로 번역까지.
원본 · 한국어 (KO)
interview_2026_05_15.mp3 MP3 · 12:34
00:00 03:08 06:17 09:25 12:34
00:00:02,400 → 00:00:06,120 안녕하세요, 오늘 인터뷰에 응해주셔서 감사합니다.
00:00:06,800 → 00:00:10,240 먼저 간단한 자기소개부터 부탁드릴게요.
00:00:11,000 → 00:00:16,520 네, 저는 작은 디자인 스튜디오를 5년째 운영하고 있고요.
00:00:17,200 → 00:00:22,080 주로 브랜드 아이덴티티와 패키지 디자인을 맡고 있습니다.
00:00:23,000 → 00:00:27,640 최근에는 해외 클라이언트 의뢰가 늘어서 번역이 꼭 필요해졌어요.
번역 · 영어 (EN)
interview_2026_05_15_en.srt SRT · 12:34
00:00 03:08 06:17 09:25 12:34
00:00:02,400 → 00:00:06,120 Hello, thank you for joining today's interview.
00:00:06,800 → 00:00:10,240 Could you start with a brief introduction?
00:00:11,000 → 00:00:16,520 Sure — I've been running a small design studio for five years now.
00:00:17,200 → 00:00:22,080 We mostly handle brand identity and packaging design.
00:00:23,000 → 00:00:27,640 Lately, overseas clients have been growing, so translation became essential.
한국어 특화 STT — 들리는 대로 정확하게, 화자별 단락 구분과 시간 코드까지.
Editor · Hands-on Review

음성 들으며
받아쓰기 직접 검수하세요

상단 오디오 바에서 재생하고, 왼쪽에서 구간을 골라
오른쪽 패널에서 받아쓰기를 직접 다듬어요.

interview_2026_05.mp3 받아쓰기 검수 구간별 편집
00:00 / 12:34 1.0x
#1 00:00:02,400 → 00:00:06,120 안녕하세요, 오늘 인터뷰에 응해주셔서 감사합니다.
#2 00:00:07,000 → 00:00:10,240 네, 불러주셔서 영광이에요.
#3 00:00:11,000 → 00:00:16,520 음, 자기소개 좀 부탁드려요.
#4 00:00:17,200 → 00:00:22,080 저는 디자인 스튜디오를 5년째 운영하고 있어요.
✨ AI가 자동 받아쓰기 + 화자 구분
세그먼트를 선택하세요
왼쪽에서 구간을 선택하면
받아쓰기 원문과 수정본이 표시돼요
구간 재생 💬코멘트 SRT 다운로드
STEP 1 · AI가 들리는 그대로 받아쓰기 + 화자 자동 구분. 타임코드는 그대로 유지돼요.
01
AI 받아쓰기
02
화자·구간 분리
03
클릭 재생
04
직접 수정
05
SRT · TXT 다운로드
🎙

한국어 특화 받아쓰기

한국어에 최적화된 STT 엔진. 한+영 혼합도 정확히 인식하고 화자까지 자동 구분.

파형 점프

파형의 어느 지점이든 클릭 = 음성이 그 시점부터 재생.

💬

세그먼트 코멘트

구간별 코멘트로 검수자·사용자가 같은 문장 두고 소통.

SRT · TXT · 어떤 형식이든 다운로드 시점에 골라받기 · 18개 받아쓰기 언어 · 12개 번역 옵션

작동 원리

업로드 한 번이면
받아쓰기·번역까지

파일을 올리고, 잠시 기다리고, 다운받으면 끝.
최대 4시간/2GB까지 한 번에 처리합니다.

01
업로드
음성·영상 파일을 그대로 끌어다 놓으세요. 옵션은 받아쓰기만 / 번역 포함 중 선택.
MP3 · WAV · MP4 · MOV · 최대 2GB
03
번역 (선택)
번역 옵션이 켜져 있으면 받아쓰기 결과를 12개 언어 중 선택한 언어로 옮겨드려요.
12 LANG · EN · JA · ZH · VI · TH 외
04
다운로드
받아쓰기는 TXT, 자막용은 SRT로 받아갑니다. 검수 옵션이면 끝난 뒤 알림톡으로 안내.
TXT · SRT
FAQ

자주 묻는 질문

최대 길이는 어떻게 되나요?

파일 1개당 최대 4시간 · 2GB까지 한 번에 처리됩니다. 그 이상은 두 개로 나눠 올려주세요. 영상은 내부에서 오디오만 추출하므로 용량 부담이 적습니다.

영상 파일도 그대로 올려도 되나요?

네, MP4·MOV·MKV·WEBM·AVI 등 일반 영상 포맷이라면 그대로 올려주세요. 서버에서 오디오 트랙만 자동으로 추출해 받아쓰기로 보냅니다. 별도 변환 작업 필요 없어요.

어떤 언어를 받아쓸 수 있나요?

한국어·영어·일본어·중국어·독일어·프랑스어·스페인어·이탈리아어·네덜란드어·스웨덴어·러시아어·힌디어·베트남어·태국어·인도네시아어·페르시아어·체코어 등 18개 언어를 지원합니다. 특히 한국어 + 영어 혼합 모드는 두 언어가 자주 섞이는 한국 기업 회의에 최적입니다.

화자가 여러 명인 회의도 구분되나요?

네, 받아쓰기 설정에서 화자 구분을 켜면 발화별로 자동으로 화자를 식별합니다. 결과물에 [화자 1], [화자 2] 식으로 라벨이 붙어 회의록·인터뷰·팟캐스트 정리에 바로 활용할 수 있어요. 예상 화자 수를 입력하면 인식 정확도가 더 높아집니다.

받아쓰기와 번역의 차이는요?

받아쓰기는 음성을 들리는 원어 그대로 텍스트로 옮기는 작업입니다. 번역 포함은 받아쓰기 결과를 다시 12개 언어 중 선택한 언어로 옮겨드려요. 한국어 회의를 영어 회의록으로 만들고 싶다면 번역 포함을 선택하세요.

정확도는 어느 정도인가요?

조용한 환경의 한국어·영어 기준으로 단어 인식률 95% 이상입니다. 잡음이 심하거나 다수 화자가 겹치는 환경에서는 떨어질 수 있어요. 방송·납품급 정확도가 필요하다면 검수 옵션을 추천드립니다 — 전문 검수자가 직접 듣고 수정합니다.

Ready to transcribe

지금 음성부터
올려보세요

분당 300원, 가입 즉시 5,000원 크레딧.
10분짜리 파일도 잠깐이면 텍스트가 됩니다.

무료로 시작하기 가격 자세히 보기