화자 다이어리제이션 가이드 - 오디오 및 비디오에서 화자 식별
TranscriptionIntermediate

화자 다이어리제이션 가이드 - 오디오 및 비디오에서 화자 식별

화자 다이어리제이션 및 식별에 대한 완벽한 가이드. AI가 다양한 화자를 감지하고, 레이블을 할당하고, 체계적인 다중 화자 트랜스크립트를 만드는 방법을 알아보세요.

화자 분리란 무엇인가?

화자 분리는 오디오 또는 비디오 녹음에서 서로 다른 화자를 자동으로 감지하고 레이블을 지정하는 프로세스입니다. “화자 분리(diarization)“라는 용어는 “일기(diary)“에서 유래되었습니다. 누가 언제 말했는지 기록하는 것입니다.

여러 사람이 참여하는 대화, 팟캐스트, 인터뷰 또는 회의를 전사할 때 화자 분리는 **“누가 무슨 말을 했는가?”**라는 중요한 질문에 답합니다.

화자 분리 없음:

오늘 팟캐스트에 오신 것을 환영합니다. 초대해 주셔서 감사합니다. 당신의 배경부터 시작해 보겠습니다. 15년 전에 기술 분야에서 일하기 시작했는데...

화자 분리 있음:

[화자 1]: 오늘 팟캐스트에 오신 것을 환영합니다.
[화자 2]: 초대해 주셔서 감사합니다.
[화자 1]: 당신의 배경부터 시작해 보겠습니다.
[화자 2]: 15년 전에 기술 분야에서 일하기 시작했는데...

더 나아가, 이름이 지정된 화자:

[John Smith]: 오늘 팟캐스트에 오신 것을 환영합니다.
[Sarah Johnson]: 초대해 주셔서 감사합니다.
[John Smith]: 당신의 배경부터 시작해 보겠습니다.
[Sarah Johnson]: 15년 전에 기술 분야에서 일하기 시작했는데...

화자 분리가 중요한 이유

화자 식별은 원시 전사본을 정리되고 사용 가능한 문서로 변환합니다.

주요 이점:

  • 명확한 귀속: 누가 무슨 말을 했는지 정확히 알 수 있습니다.
  • 더 나은 이해: 대화를 쉽게 따라갈 수 있습니다.
  • 쉬운 인용: 특정 사람의 진술을 추출할 수 있습니다.
  • 회의록: 결정 및 실행 항목을 속성별로 분류할 수 있습니다.
  • 인터뷰 분석: 화자별로 Q&A를 구성할 수 있습니다.
  • 팟캐스트 제작: 호스트/게스트 레이블로 쇼 노트를 만들 수 있습니다.
  • 연구: 개별 화자의 기여도를 분석할 수 있습니다.

사용 사례:

  • 비즈니스 회의 (누가 어떤 결정을 내렸는지 추적)
  • 인터뷰 (인터뷰어와 인터뷰 대상자 분리)
  • 팟캐스트 (호스트 대 게스트 식별)
  • 포커스 그룹 (개별 참가자 추적)
  • 법률 심문 (변호사 대 증인)
  • 고객 통화 (상담원 대 고객)
  • 컨퍼런스 패널 (무대에 여러 명의 화자)

화자 분리 작동 방식 (과학적 원리)

ScreenApp은 고급 AI를 사용하여 화자를 감지하고 분리합니다.

1단계: 음성 특징 추출

AI는 각 세그먼트에 대한 오디오 특성을 분석합니다.

  • 피치: 음성의 기본 주파수
  • 톤: 음색 및 음질
  • 말투: 말하는 리듬과 속도
  • 에너지: 음량 및 강조 패턴
  • 포먼트: 성도 공명 주파수

이러한 특징은 각 화자에 대한 고유한 “음성 지문”을 만듭니다.

2단계: 화자 클러스터링

AI는 유사한 음성 세그먼트를 그룹화합니다.

  1. 전체 녹음에서 음성 특징을 분석합니다.
  2. 유사한 음성의 뚜렷한 클러스터를 식별합니다.
  3. 각 클러스터에 화자 레이블을 할당합니다 (화자 1, 화자 2 등).
  4. 세그먼트는 음성 유사성을 기반으로 화자별로 그룹화됩니다.

클러스터링 작동 방식:

  • AI는 음성 변화 (다른 피치, 톤 등)를 감지합니다.
  • 다른 타임스탬프에 걸쳐 유사한 음성이 함께 그룹화됩니다.
  • 각 클러스터는 한 명의 화자가 됩니다.
  • 클러스터는 순차적으로 번호가 매겨집니다 (화자 1, 2, 3…).

3단계: 세그먼트 할당

모든 발화 세그먼트는 화자에게 할당됩니다.

  1. AI가 한 화자가 멈추고 다른 화자가 시작되는 지점을 결정합니다.
  2. 각 세그먼트는 화자 레이블을 받습니다.
  3. 타임스탬프는 각 화자가 말하는 시점을 표시합니다.
  4. 대화록은 화자별로 정리되어 표시됩니다.

정확도 요인:

  • 명확하고 뚜렷한 음성: 90-95% 정확도
  • 유사한 음성의 화자: 75-85% 정확도
  • 겹치는 발화: 60-75% 정확도
  • 배경 소음: 정확도를 10-20% 감소시킴

4단계: AI 화자 이름 제안 (선택 사항)

특정 콘텐츠 유형의 경우 AI가 화자 이름을 제안할 수 있습니다.

  1. 대화 내용 분석
  2. 화자 소개(“안녕하세요, 저는 John입니다…”) 검색
  3. 역할 패턴 감지(인터뷰어 대 인터뷰 대상)
  4. 상황 단서를 기반으로 이름 제안

제안을 수락하거나 이름을 수동으로 할당할 수 있습니다.


단계별 안내: 화자 분리 사용하기

1단계: 다중 화자 오디오/비디오 업로드

  1. ScreenApp으로 이동
  2. **“업로드”**를 클릭하거나 파일을 드래그 앤 드롭합니다.
  3. 또는 회의 녹음의 경우 **“URL에서 가져오기”**를 사용하십시오.
  4. 업로드가 완료될 때까지 기다립니다.

화자 분리에 가장 적합한 콘텐츠:

  • ✅ 인터뷰 (2명의 화자)
  • ✅ 팟캐스트 (호스트 + 게스트)
  • ✅ 회의 (3-10명의 참가자)
  • ✅ 패널 토론 (여러 화자)
  • ✅ 고객 통화 (2명의 화자)
  • ⚠️ 대규모 컨퍼런스 (10명 이상의 화자 - 복잡할 수 있음)

파일 요구 사항:

  • 깨끗한 오디오 (최소 배경 소음)
  • 뚜렷한 음성 (다른 음높이/톤)
  • 최소한의 화자 중복
  • 좋은 마이크 품질

2단계: 화자 분리를 통한 자동 대화록 작성

업로드 후:

  1. ScreenApp이 자동으로 오디오를 텍스트로 변환합니다.
  2. 상태는 “텍스트 변환 중…” 그런 다음 **“화자 분리 중…”**으로 표시됩니다.
  3. AI가 텍스트 변환 중에 다른 화자를 감지합니다.
  4. 화자 레이블이 자동으로 할당됩니다 (화자 1, 화자 2 등).
  5. 대부분의 녹음의 경우 1-3분 안에 처리가 완료됩니다.

화자 분리 중 발생하는 작업:

  • 음성-텍스트 변환
  • 음성 지문 추출
  • 화자 클러스터링 및 세분화
  • 화자별 타임스탬프 할당
  • 선택적 AI 이름 제안

처리 시간:

  • 2인 대화: 오디오 10분당 ~1분
  • 3-5명의 화자: 10분당 ~1.5분
  • 6명 이상의 화자: 10분당 ~2분

3단계: 화자 라벨링된 기록 검토

처리가 완료되면 다음을 수행합니다.

  1. 파일을 클릭하여 엽니다.
  2. 기록 탭으로 이동합니다.
  3. 각 세그먼트는 화자 라벨(화자 1, 화자 2 등)을 표시합니다.
  4. 화자 라벨은 각 대화 세그먼트 앞에 나타납니다.

기록 형식:

화자 1: 오늘 회의에 오신 것을 환영합니다.
화자 2: 초대해 주셔서 감사합니다.
화자 1: 분기별 업데이트부터 시작하겠습니다.
화자 3: 원하시면 먼저 숫자를 발표할 수 있습니다.

정확성 검토:

  • 서로 다른 화자가 다른 라벨을 가지고 있는지 확인합니다.
  • 화자 변경이 올바른 타임스탬프에서 발생하는지 확인합니다.
  • 잘못 라벨링된 세그먼트(잘못된 화자)를 찾습니다.
  • 여러 화자가 하나로 그룹화되었는지 확인합니다.

4단계: 화자에게 실제 이름 할당

일반 라벨을 실제 이름으로 바꿉니다.

  1. 기록 탭에서 화자의 세그먼트를 찾습니다.
  2. 화자 라벨(예: “화자 1”)을 클릭합니다.
  3. 다음을 표시하는 드롭다운이 나타납니다.
    • 현재 화자 라벨
    • AI 제안 이름(사용 가능한 경우)
    • 팀원(작업 공간 연결된 경우)
    • 사용자 지정 이름을 입력하는 옵션
  4. 사람의 실제 이름을 선택하거나 입력합니다.
  5. 클릭하여 확인합니다.

해당 화자의 모든 세그먼트가 기록 전체에서 자동으로 업데이트됩니다.

이름 할당:

이전:
화자 1: 소개부터 시작하겠습니다.
화자 2: 안녕하세요, 저는 마케팅 부서의 Sarah입니다.

이름 지정 후:
John Smith: 소개부터 시작하겠습니다.
Sarah Johnson: 안녕하세요, 저는 마케팅 부서의 Sarah입니다.

이름 할당 옵션:

  • AI 제안: AI가 컨텍스트에서 이름을 감지한 경우
  • 팀원: 작업 공간 멤버에서 선택
  • 사용자 지정 이름: 이름을 수동으로 입력
  • 라벨 지우기: 사용자 지정 이름을 제거하고 화자 X로 되돌립니다.

5단계: 대량 화자 편집 (선택 사항)

여러 화자 할당을 변경해야 하는 경우:

  1. 일부 세그먼트가 잘못 라벨링되었을 수 있습니다(화자 1은 화자 2여야 함).
  2. 잘못 라벨링된 세그먼트를 클릭합니다.
  3. 화자 할당을 변경합니다.
  4. ScreenApp을 사용하면 개별 세그먼트를 편집할 수 있습니다.

대량 편집을 사용하는 경우:

  • AI가 비슷한 소리를 내는 두 화자를 혼동한 경우
  • 여러 화자가 하나의 라벨로 병합된 경우
  • 한 화자가 여러 라벨로 분할된 경우

편집 워크플로:

  1. 잘못된 라벨링 패턴을 식별합니다.
  2. 잘못된 화자가 있는 세그먼트를 클릭합니다.
  3. 올바른 화자에게 다시 할당합니다.
  4. 다른 잘못 라벨링된 세그먼트에 대해 반복합니다.

화자 감지 정확도 향상

녹음하기 전에

오디오 설정을 최적화합니다:

  • 고품질 마이크 사용 (내장 마이크보다 외부 마이크 선호)
  • 각 화자로부터 6-12인치 거리에 마이크 위치
  • 배경 소음 줄이기 (창문 닫기, 선풍기 끄기)
  • 가능한 경우 각 화자에 대해 별도의 마이크 사용
  • 녹음하기 전에 오디오 레벨 테스트

녹음 환경:

  • 울림이 최소화된 조용한 방
  • 단단한 표면 피하기 (부드러운 가구를 사용하여 잔향 줄이기)
  • 겹치는 음악 또는 배경 오디오 없음
  • 종이 바스락거리는 소리와 키보드 타이핑 최소화

말하기 지침:

  • 서로 겹쳐서 말하지 마십시오.
  • 화자 사이에 짧은 멈춤을 허용합니다.
  • 정상적인 볼륨과 속도로 말하십시오.
  • 속삭이거나 소리치지 마십시오.
  • 마이크와의 일정한 거리 유지

화자 분리 중

화자 분리 정확도가 낮은 경우:

  1. 오디오 품질 확인: 오디오 품질 불량 = 화자 감지 불량

    • 가능하면 더 나은 마이크로 다시 녹음
    • 업로드하기 전에 노이즈 감소 도구 사용
    • 볼륨 레벨이 적절한지 확인
  2. 화자 수 확인: 감지된 화자가 너무 많거나 너무 적음

    • AI가 실제보다 적은 수의 화자를 감지한 경우: 목소리가 너무 유사함
    • AI가 실제보다 많은 수의 화자를 감지한 경우: 한 사람의 목소리가 너무 다양함
    • 이 경우 수동 수정 필요
  3. 화자 변경 검토: 전환이 정확한가?

    • AI가 화자가 변경되었다고 생각하는 위치 확인
    • 실제 화자 전환과 일치하는지 확인
    • 필요한 경우 수동으로 수정

화자 분리 후

수동 정리:

  • 잘못 레이블이 지정된 세그먼트에 대한 전체 기록 검토
  • 화자가 겹치는 섹션에 집중
  • 화자가 불분명한 모호한 세그먼트 수정
  • 이름이 전체적으로 올바르게 할당되었는지 확인

품질 검사:

  1. 기록 전체에서 임의의 세그먼트 샘플링
  2. 화자 레이블이 오디오와 일치하는지 확인
  3. 모든 화자가 식별되었는지 확인
  4. 화자가 여러 레이블로 분할되지 않았는지 확인

일반적인 화자 분리 과제

과제 1: 유사한 목소리

문제: 비슷한 음높이/톤을 가진 두 화자가 혼동됨

예시 시나리오:

  • 비슷한 음성 특성을 가진 두 남성 화자
  • 가족 구성원 (유사한 유전 = 유사한 목소리)
  • 같은 지역 출신 화자 (유사한 억양)

해결 방법:

  1. 스위치에 대한 기록을 주의 깊게 검토
  2. 문맥 단서 사용 (누가 무슨 말을 할까)
  3. 잘못 레이블이 지정된 세그먼트 수동으로 다시 할당
  4. 향후 녹음에서 화자가 주기적으로 자신을 식별하도록 함

정확도: 유사한 목소리의 경우 90-95%에서 75-85%로 감소

과제 2: 겹치는 음성

문제: 여러 사람이 동시에 말함

예시 시나리오:

  • 열띤 토론에서의 크로스 토크
  • 동시 동의 (“예!” 여러 사람으로부터)
  • 문장 중간의 중단

해결 방법:

  1. AI는 일반적으로 더 큰 소리의 화자에게 할당
  2. 겹치는 부분은 기록에서 불분명할 수 있음
  3. 중요한 겹침에 대한 수동 검토 필요
  4. 앞으로: 발언 순서를 정하거나 손을 들어 사용

정확도: 겹치는 음성 중에는 60-75%로 감소

Challenge 3: Single Speaker with Variable Voice

Problem: One person’s voice changes significantly

Causes:

  • Emotional changes (calm to excited)
  • Physical changes (standing vs sitting)
  • Distance from microphone varies
  • Cold or illness affecting voice
  • Shouting or whispering

Solution:

  1. AI may split one person into multiple speakers
  2. Review and merge speaker labels if needed
  3. Manually reassign segments to correct speaker

Challenge 4: Background Voices

Problem: Ambient voices detected as speakers

Example scenarios:

  • Someone talks in the background
  • TV or radio playing
  • Nearby conversation
  • Voice from phone call on speaker

Solutions:

  1. AI may create extra speaker labels for background voices
  2. Manually remove or ignore these segments
  3. In future: Mute background audio sources during recording

Challenge 5: Phone/Video Call Audio

Problem: Compressed audio from calls reduces accuracy

Causes:

  • Call compression degrades voice quality
  • Network issues cause audio artifacts
  • Speaker phone echo
  • Low bitrate audio

Solutions:

  1. Record locally if possible (not just the call audio)
  2. Use high-quality call recording tools
  3. Avoid speakerphone when possible
  4. Ensure strong network connection
  5. Accept that accuracy may be 10-15% lower for call recordings

Speaker Diarization Use Cases

1. Meeting Documentation

Workflow:

  1. Record meeting (Zoom, Google Meet, Teams)
  2. Upload to ScreenApp for transcription + diarization
  3. Assign names to each participant
  4. Export transcript with speaker labels
  5. Distribute meeting minutes to team

Benefits:

  • Clear attribution of who said what
  • Track decisions and action items by person
  • Accountability for commitments made
  • Easy to extract quotes for summaries

Example output:

[John Smith - CEO]: Let's review Q4 goals.
[Sarah Johnson - CFO]: Revenue is up 15% this quarter.
[Mike Chen - CTO]: We launched 3 new features.

2. 인터뷰 녹취록

기자/연구자 워크플로:

  1. 인터뷰 녹음 (대면 또는 원격)
  2. 화자 분리된 녹취록 획득
  3. 인터뷰 진행자와 피면접자 라벨 지정
  4. 적절한 출처 표기와 함께 인용문 추출
  5. 기사 작성 또는 연구 분석에 사용

장점:

  • 특정인의 발언을 쉽게 찾을 수 있음
  • 출판을 위한 정확한 인용문 출처 표기
  • 인터뷰 패턴 분석
  • Q&A 형식의 녹취록 생성

예시 형식:

[인터뷰 진행자]: 회사를 시작하게 된 계기는 무엇입니까?
[피면접자]: 시장에 틈새가 있다는 것을 알게 되었습니다...
[인터뷰 진행자]: 초기 개발 자금은 어떻게 조달했습니까?
[피면접자]: 처음 2년 동안은 자체 자금으로 운영했습니다...

3. 팟캐스트 제작

팟캐스터 워크플로:

  1. 게스트와 함께 팟캐스트 에피소드 녹음
  2. 화자 분리된 녹취록 획득
  3. 진행자와 게스트 이름 지정
  4. 녹취록에서 쇼 노트 생성
  5. 소셜 미디어를 위한 하이라이트 추출

장점:

  • 화자 표기와 함께 쇼 노트 자동 생성
  • 에피소드 요약을 쉽게 생성
  • 특정 게스트 인용문 추출
  • 검색 가능한 팟캐스트 아카이브 구축
  • 에피소드에서 블로그 게시물 생성

팟캐스트 쇼 노트 예시:

[00:00] - 존 (진행자) 에피소드 주제 소개
[02:15] - 사라 (게스트) 그녀의 배경 공유
[15:30] - 주요 주제 토론
[42:00] - 속사포 Q&A 세그먼트

4. 포커스 그룹 분석

시장 조사 워크플로:

  1. 포커스 그룹 세션 녹음
  2. 참가자 분리를 위한 화자 분리
  3. 참가자 ID 할당 (익명성을 위해 참가자 1, 2, 3)
  4. 참가자별 응답 분석
  5. 주제 및 패턴 추출

장점:

  • 개별 참가자 기여도 추적
  • 지배적인 참가자와 조용한 참가자 분석
  • 개인별 특정 피드백 추출
  • 참여율 정량화
  • 합의 또는 불일치 식별

5. 고객 서비스 통화 분석

콜센터 워크플로:

  1. 고객 지원 통화 녹음
  2. 상담원 vs 고객 화자 분리
  3. 통화 패턴 분석
  4. 성공적인 문제 해결 기술 추출
  5. 모범 사례를 기반으로 상담원 교육

장점:

  • 상담원과 고객 음성을 자동으로 분리
  • 상담원 성과 분석
  • 일반적인 고객 불만 사항 식별
  • 고객의 정확한 인용문 추출
  • 통화 품질 및 규정 준수 모니터링

화자 라벨링된 녹취록 내보내기

화자 분리된 녹취록을 다양한 형식으로 다운로드:

스피커 라벨이 포함된 내보내기 형식

  1. 일반 텍스트(.txt) - 스피커 이름이 포함된 간단한 형식

    John Smith: 이것은 첫 번째 요점입니다.
    Sarah Johnson: 그 평가에 동의합니다.
    
  2. 워드 문서(.docx) - 스피커 이름 및 타임스탬프와 함께 포맷됨

    • 각 스피커 변경은 새 줄에 표시
    • 타임스탬프 포함
    • 스피커 이름은 굵게 표시
  3. PDF 문서(.pdf) - 전문적인 형식

    • 깔끔한 스피커 속성
    • 공유를 위해 포맷됨
    • 선택적 타임스탬프
  4. SRT 자막(.srt) - 캡션에 스피커 이름이 포함된 비디오용

    1
    00:00:01,000 --> 00:00:03,500
    [John Smith]: 이것은 첫 번째 요점입니다.
    

내보내는 방법

  1. 분리된 스크립트 열기
  2. “다운로드” 버튼 클릭
  3. 형식 선택 (TXT, DOCX, PDF, SRT)
  4. 스피커 이름이 포함된 파일 다운로드

스피커 이름 보존:

  • 모든 형식에 할당된 스피커 이름이 포함됨
  • 이름이 할당되지 않은 경우 일반 레이블(스피커 1, 2, 3) 사용
  • 타임스탬프는 Word, PDF 및 SRT 형식에 포함됨

화자 분리 vs 수동 레이블 지정

자동 화자 분리가 시간을 절약하는 시점 이해:

요소자동 화자 분리수동 레이블 지정
속도1-3분 처리녹음 길이의 10배
정확도90-95% (양호한 오디오)100% (주의하는 경우)
노력검토 + 이름 할당필사 + 수동으로 레이블 지정
비용AI 처리시간 비용
최적대부분의 녹음중요한 법률/의료

자동 화자 분리를 사용해야 하는 경우:

  • 일반 비즈니스 회의
  • 팟캐스트 및 인터뷰
  • 대부분의 연구 애플리케이션
  • 콘텐츠 제작
  • 내부 문서

수동 검토가 필수적인 경우:

  • 법적 증언
  • 의료 상담
  • 중요한 비즈니스 협상
  • 게시된 연구
  • 규정 준수 필수 녹음

하이브리드 접근 방식 (모범 사례):

  1. 초기 통과를 위해 자동 화자 분리 사용
  2. 정확도 수동 검토
  3. 오류 수정
  4. 중요한 세그먼트 확인
  5. 최종 버전 내보내기

고급 화자 분리 기능

AI 스피커 이름 감지

특정 콘텐츠의 경우 AI가 스피커 이름을 제안할 수 있습니다.

작동 방식:

  1. AI가 스크립트 컨텍스트 분석
  2. 자기 소개(“안녕하세요, 저는 John입니다…”) 검색
  3. 패턴 감지 (호스트 대 게스트, 인터뷰어 대 피험자)
  4. 컨텍스트를 기반으로 이름 제안

사용 가능 시기:

  • 공식적인 소개가 있는 인터뷰
  • 호스트/게스트 구조의 팟캐스트
  • 참가자가 자신을 소개하는 회의

제안 수락:

  1. AI가 제안한 이름 검토
  2. 올바른 스피커와 일치하는지 확인
  3. 필요에 따라 수락 또는 수정
  4. AI는 사용자의 수정 사항을 학습

팀 구성원 통합

스피커를 작업 공간에 연결하세요:

  1. 회의 참가자를 팀 구성원에 할당
  2. 스피커 라벨이 사용자 프로필에 연결됨
  3. 스크립트에서 팀 구성원 자동 태깅
  4. 회의 전반에 걸쳐 개인 기여도 추적

혜택:

  • 모든 회의에서 일관된 스피커 이름
  • 이메일/프로필에 연결
  • 팀 구성원별 분석
  • 사람별 검색 가능

다국어 화자 분리

ScreenApp은 100개 이상의 언어로 화자 분리 기능을 제공합니다.

  1. 모든 언어로 오디오 업로드
  2. AI가 언어를 자동으로 감지
  3. 화자 분리는 언어에 관계없이 작동
  4. 스피커 이름은 모든 언어로 가능

지원되는 언어: 스크립트에 지원되는 모든 언어는 화자 분리도 지원합니다.


개인 정보 보호 및 스피커 데이터

ScreenApp은 스피커 데이터를 안전하게 처리합니다.

데이터 보호:

  • 음성 지문은 화자 분리를 위해 일시적으로 생성됨
  • 처리가 완료된 후에는 저장되지 않음
  • 스피커 이름은 사용자가 제어
  • 제3자 공유 없음
  • 언제든지 삭제

민감한 녹음의 경우:

  • 익명화된 스피커 라벨 사용 (참가자 1, 2, 3)
  • 개인 정보 보호가 필요한 경우 실제 이름을 할당하지 마십시오.
  • 누가 스크립트에 접근할 수 있는지 제어
  • 분석 완료 후 삭제

다음 단계

이제 화자 분리를 이해했으므로 다음과 같은 관련 주제를 살펴보십시오.


지금 화자 분리를 사용해 보세요

ScreenApp은 자동 화자 분리, AI 이름 제안 및 쉬운 스피커 할당으로 스피커 식별을 간편하게 해줍니다. 다중 스피커 녹음을 체계적이고 귀속 가능한 스크립트로 변환하십시오.

첫 번째 녹음에서 스피커를 식별할 준비가 되셨습니까? ScreenApp의 화자 분리를 무료로 사용하고 이 가이드를 따르십시오.