Apresentação: PPT - PPSX - PPTX - HTML | Relatório: PDF - DOC - DOCX - HTML | Videos: MiPAD I - MiPAD II
Programa Demonstrativo - IE * | Pacote Completo (sources incluidos) - ZIP | Pacote Reduzido (apenas PDF, PPT e Demo) - ZIP

Este trabalho foi desenvolvido no âmbito da cadeira de Processamento da Voz - Ano Lectivo 2006/ 2007
Escola Superior de Tecnologia do Instituto Politécnico de Castelo Branco

Autores: António Afonso, Nelson Vicente, Ricardo Antunes


Maio 2007


Breve Introdução ao Tema

A rápida disseminação dos computadores pessoais, hoje facilmente acessíveis para a maioria das pessoas, conjuntamente com a sua grande evolução e influência, faz com que exista uma séria necessidade de facilitar a comunicação e interacção entre o homem e a máquina.

As técnicas de síntese e reconhecimento de voz, têm sido introduzidas cada vez mais em aplicações, com o intuito de melhorar as interfaces com os utilizadores, de produzir novos mecanismos de interacção com computadores e ainda com o intuito de abranger um maior número de utilizadores.

Um dos maiores desafios de um conversor texto-fala prende-se com a necessidade de interpretar correctamente as palavras e o seu contexto, de modo a que lhe seja permitido concretizar um pré-processamento eficaz e livre de erros, assim como a aplicação com padrões adequados. Toda esta lógica contida num conversor texto-fala implica custos adicionais de processamento, e torna-se mais falível à medida que se necessita de mais inteligência por parte do conversor.

Breve Introdução ao Microsoft Speech API - SAPI

O Speech Application Programming Interface, ou SAPI, é uma API desenvolvida pela Microsoft para permitir o uso do Speech Recognition e Speech Synthesis nas aplicações Windows.

A Microsoft fundou um grupo de desenvolvimento de aplicações de fala em 1993. Em 1995, este grupo publica o SAPI1 como uma plataforma de desenvolvimento de aplicações baseada na fala para o Windows. Seguiu-se o SAPI 2, SAPI 3 e SAPI 4 em 1998. Nesta altura o grupo foi transferido para o núcleo de desenvolvimento de Speech.NET, onde publicou o SAPI 5 e o SAPI 5.1 em 2001. O grande objectivo destas aplicações é a função de interface com a plataforma do Windows, fornecendo o serviço de motores de conversão texto-fala e reconhecimento de fala. Actualmente o Windows 2000 e o Windows XP já integram nas suas distribuições a plataforma SAPI.

De entre todas as versões distribuídas pela Microsoft, o SAPI4 e o SAPI5 são os mais conhecidos e utilizados entre a comunidade empresarial e científica. Algumas das aplicações que usam o SAPI são o Microsoft Office, o Microsoft Agent, o Microsoft Speech Server entre muitas outras. O SAPI é um componente distribuído gratuitamente que pode ser usado em qualquer aplicação do Windows que necessite de tecnologia de reconhecimento de voz. Várias versões (contudo, nem todas) de reconhecimento de voz e de sintetizadores são também distribuídas gratuitamente.


Atenção, estas introduções não dispensam a consulta integral do Documento.
Por favor verifique os links no menu em cima.
Está disponível uma apresentacao PPT ou formato HTML, bem como outros recursos.
Obrigado!

* Internet Explorer. Poderá ser necessário instalar o Speech SDK 5.1 disponível em http://www.microsoft.com/speech/download/sdk51/

Alojamento deste site com o apoio de areadeservico.com e gaveta.net
A tua Pen Drive Online. Visita gaveta.net