Google은 Chrome의 음성 받아쓰기가 훨씬 더 자연스럽게 느껴지도록 조용히 만들고 있습니다. 최신 Chrome 151 베타를 통해 회사는 브라우저의 음성 인식 엔진이 사람들이 말하는 방식을 기반으로 구두점을 자동으로 추론할 수 있는 새로운 기능을 도입하여 ‘쉼표’ 또는 ‘마침표’와 같은 명령을 명시적으로 말할 필요가 없습니다.
이 업데이트는 언뜻 보기에 사소해 보일 수 있지만 음성 입력에 대한 가장 큰 불만 사항 중 하나를 해결합니다. 즉, 사용자가 의식적으로 모든 구두점을 받아쓰지 않는 한 자연스럽게 말하면 구두점이 부족한 텍스트가 생성되는 경우가 많습니다. Chrome에 일시 중지, 리듬, 음성 패턴을 이해하도록 교육함으로써 Google은 컴퓨터와의 대화가 더욱 인간적인 느낌을 갖도록 만드는 데 한 걸음 더 다가서고 있습니다.
Chrome은 사용자가 말하는 내용뿐만 아니라 말하는 방식도 이해하려고 합니다.
새로운 기능은 Chrome 151 베타의 Web Speech API를 통해 제공됩니다. 구글이 새로운 것을 추가했습니다. 무언의구두점 부울 속성 음성인식 인터페이스. 활성화되면 음성 인식 엔진은 사용자에게 구두점 명령을 큰 소리로 말하도록 요구하는 대신 일시 중지, 억양 및 운율을 기반으로 구두점을 자동으로 삽입합니다.
실제로 이는 사용자가 보다 자연스러운 대화 스타일로 이메일, 문서 또는 메시지를 지시할 수 있으며 Chrome은 쉼표, 마침표 및 기타 문장 부호가 속하는 위치를 결정합니다.

이 개선 사항은 “쉼표”, “마침표” 또는 “물음표”를 반복적으로 말하면 자연스러운 음성 흐름을 방해하는 긴 받아쓰기 세션에 특히 유용합니다. 또한 브라우저 기반 전사 도구, 메모 작성 애플리케이션, 접근성 소프트웨어 및 AI 기반 글쓰기 보조 기능이 훨씬 더 원활하게 느껴질 수 있습니다.
개발자도 혜택을 볼 수 있습니다
이 기능은 Chrome Web Speech API의 일부이므로 음성 인식을 사용하는 웹 애플리케이션은 자체 구두점 모델을 구축하지 않고도 기능을 구현할 수 있습니다.
구글은 이 기능이 음성에만 의존하는 것이 아니라 음성 일시정지 및 운율을 분석하여 브라우저 기반 음성 인식을 인간이 자연스럽게 의사소통하는 방식에 더 가깝게 만든다고 말합니다.

이번 추가는 또한 Google의 소프트웨어 생태계 전반에 걸친 광범위한 추세를 반영합니다. Gemini 및 AI 기반 언어 모델이 Chrome, Android 및 Workspace와 같은 제품에 점점 더 통합됨에 따라 회사는 사용자에게 음성을 기계에 맞게 조정하도록 요구하는 대신 자연스러운 인간 대화를 이해하는 데 더 중점을 두고 있습니다.
Chrome 151 베타에는 개발자가 테스트할 수 있는 기능이 이미 포함되어 있지만, 더 폭넓은 가용성은 브라우저의 안정적인 출시 일정에 따라 달라집니다. 많은 실험적 API와 마찬가지로 개발자는 궁극적으로 이 API가 웹 애플리케이션 전반에 걸쳐 얼마나 광범위하게 채택되는지 결정하게 됩니다.
자동 구두점이 하룻밤 사이에 음성 입력을 변화시킬 수는 없지만 사용자가 메시지를 받아쓰거나 대화를 기록할 때마다 느낄 수 있는 일종의 삶의 질 향상입니다. 때때로 가장 큰 업그레이드는 화려한 새로운 AI 기능이 아니라 사람들이 이미 의사소통하는 방식을 더 잘 이해할 수 있도록 기술을 만드는 작은 변화입니다.
관련 정보는 아래 링크에서 확인하세요