Technologie

Wat is het verband tussen spraaksynthese en herkenning?

Spraaksynthese en herkenning zijn de twee zijden van geautomatiseerde spraakanalyse.Spraaksynthese is het creëren van menselijke spraak door een computer;Een computer die bijvoorbeeld schriftelijke tekst leest.Spraakherkenning is het creëren van computerinformatie uit gesproken woorden, zoals het dicteren van een paper aan een computer.Hoewel de twee processen niet direct gerelateerd zijn, vertrouwen spraaksynthese en herkenning zowel op het vermogen van een computer om menselijke spraak en verbuiging te begrijpen.De ene methode is uitvoer en de andere is invoer.

De processen die worden gebruikt door spraaksynthese en herkenning zijn erg vergelijkbaar, zelfs als het eindproduct anders is.Het proces bestaat uit twee delen, een deel met menselijke interactie en één zonder.Het menselijke gedeelte is wanneer menselijke woorden het programma betreden;Het niet-menselijke deel is wanneer het programma de input interopereert.

Een spraaksyntheseprogramma neemt menselijke input in de vorm of getypte of geschreven menselijke taal.Het programma zal de taal lezen en bepalen wat elk woord is, met behulp van zinsplaatsing en interpunctie om buiging te bepalen.Wanneer een woord op meerdere manieren kan worden uitgesproken, zoals in het geval van ‘live’, zal het programma zoeken naar woorden en contextaanwijzingen in de buurt om te bepalen welk woord daadwerkelijk wordt gebruikt.De woorden gaan dan naar het tweede deel van het programma, waar ze hardop worden gesproken.

In een spraakherkenningsprogramma is het proces tegengesteld.De input komt van een menselijke spreker die woorden in een computer zegt.De computer luistert naar elk woord en vergelijkt het patroon dat wordt gegenereerd door de stem van de spreker met een bibliotheek met mogelijke geluiden en woorden.Vervolgens is het een bepaling van het meest waarschijnlijke woord en stuurt het naar het tweede deel van het systeem.Dit gedeelte drukt de woorden op het scherm af, vergelijkbaar met hoe het syntheseprogramma de woorden zegt.

Aangezien elke spreker enigszins anders klinkt, hebben spraaksynthese en herkenningsprogramma's vaak een brede foutenmarge.Een van de manieren waarop mensen deze fouten bestrijden, is via geïndividualiseerde spraakprofielen.Een enkele spreker zal zijn toespraak door het programma laten analyseren om zijn specifieke vocale patronen te vinden.Wanneer hij fouten vindt in de computervertaling, kan hij ze specifiek corrigeren.De correcties worden geanalyseerd en opgeslagen door het programma, dus wanneer het lastige woord weer opkomt, zal het programma het correct vertalen.

Er is een brede toepassing voor spraaksynthese en herkenningsprogramma's.Op medisch gebied stellen deze programma's mensen in staat om te communiceren die anders misschien niet in staat zijn.Deze programma's hebben een brede toepassing in het bedrijfsleven als een sneller middel om rapporten en documenten te vertalen.Spraakherkenning is ook een veel voorkomende methode om handsfree apparaten in auto's op te zetten, waardoor mensen tijdens het rijden veiliger aan de telefoon kunnen praten.