Buscar ventana

Reconocimiento de voz en cualquier lugar - Extensión de Chrome

Use el reconocimiento de voz para completar formularios y documentos en Internet. Controla Internet con tu voz.

voz, reconocimiento, voz, cromo, extensión, voz a texto, hablar, forma, escribir, escribir

Reconocimiento de voz en cualquier lugar - Extensión de Chrome

Publicado en 11 de diciembre de 2016
Ultima actualización en 2 de enero de 2023

Reconocimiento de voz en cualquier lugar

Escriba correos electrónicos con su voz
Escribe documentos con tu voz
Controla Internet con tu voz
Extensión de Chrome

Por Jeff Baker

Suscríbase a la fuente de consejos y herramientas de Internet

f Compartir
0

Compartir G+
0

Twittear
0

en Compartir
0

P en eso
0

Newsletter

Don't miss out on new Internet Tips and Tools. Sign up for the seabreezecomputers.com Internet Tips and Tools newsletter:

A message from Sea Breeze Computers

We apologize for the interruption. However, seabreezecomputers.com has been offering free tools and downloads for many years. Unfortunately, server expenses are now starting to exceed revenue earned. If you appreciate the free tools and downloads at seabreezcomputers.com please consider making a donation.

Con "Reconocimiento de voz en cualquier lugar" puedes controlar Internet con tu voz. ¡Use el reconocimiento de voz para completar entradas, áreas de texto, formularios o documentos en Internet! El discurso que pronuncia se escribe automáticamente en el formulario del sitio web. "Reconocimiento de voz en cualquier lugar" también se puede utilizar como un asistente virtual increíble. Descargue la extensión de reconocimiento de voz en cualquier lugar para Chrome o Edge hoy mismo. Un usuario puede usar comandos de voz simples para ir a sitios web o hacer clic en botones y enlaces. También funciona con Google Docs, Microsoft Word en línea, Gmail, Outlook.com y más. Los profesionales médicos lo utilizan para completar registros médicos en línea basados en la web. Los profesionales de negocios lo utilizan para dictar cartas y correos electrónicos. El usuario puede crear comandos personalizados para permitirle decir frases abreviadas que imprimen una gran cantidad de texto en un formulario.

Obtener extensión

Características

Extensión del navegador para Chrome o Add-on para el navegador Edge para computadoras de escritorio y portátiles.
Modo asistente virtual.
Elija entre docenas de idiomas y dialectos para el reconocimiento de voz.
Dictar correos electrónicos y documentos en línea.
Rellena formularios con tu voz.
Ir al campo siguiente o anterior con su voz.
Ve a cualquier sitio web con tu voz.
Cambia de pestaña y navega por sitios web con tu voz.
Desplazar la página hacia arriba o hacia abajo.
Haga clic en enlaces y botones con su voz.
Cortar, Copiar, Pegar, Borrar, Resaltar.
Di "Mostrar etiquetas" para ver las etiquetas de los botones en un sitio web.
Di "Mostrar números" para ver los números junto a los enlaces y botones. Luego diga "Haga clic en (número)".
Di "Youtube (nombre del artista o canción) (de fondo)" para reproducir música al instante.
Cree comandos de voz personalizados.
Texto a voz.
Scripting.
Puntuación automática.
Exportar/Importar comandos personalizados.

Obtener extensión

Comandos personalizados

Busque en los comentarios a continuación los "Comandos personalizados" que puede agregar a Speech Recognition Anywhere. Si ha creado algunos comandos increíbles para Speech Recognition Anywhere, compártalos en la sección de comentarios a continuación. (Si tiene direcciones URL (http: https:) en la acción, rodéela con<code> </code>etiquetas para que el cuadro de comentarios no lo convierta en un enlace).

Para crear comandos personalizados, no necesita usar expresiones regulares, pero las expresiones regulares harán que sus comandos personalizados sean más potentes. Por ejemplo, podría crear este comando personalizado básico:

Frase: Mostrar el satélite meteorológico
Acción: https://weather.weatherbug.com/maps/
Descripción: Mostrar el satélite meteorológico

Pero tendría que decir la frase exacta, "Mostrar el satélite meteorológico" para que se muestre la imagen del satélite. Pero si usa expresiones regulares como en el ejemplo a continuación, puede decir varias oraciones similares para activar el comando:

Frase: (?:Mostrar|Muéstrame)(?:.*?)?(?:satélite|nubes)(?:.*?)?(?:para |de |en )?(.*?)?
Acción: https://weather.weatherbug.com/maps/$1
Descripción: Mostrar el satélite meteorológico

Con la frase anterior podrías decir "Muéstrame las nubes" o "Mostrar el satélite meteorológico de Nueva York". Aquí hay un desglose de la frase:

(?:Mostrar|Muéstrame) significa buscar "display" o "show". Él | símbolo significa "o". Poniendo ?: al comienzo del partido dentro de los paréntesis () significa buscar la coincidencia pero no recordar la coincidencia.

(?:.*?)? significa buscar cualquier cantidad de palabras opcionales como "the" o "the weather" y no recordar la coincidencia. Él ? al final fuera de los paréntesis () significa que estas palabras son opcionales. Por ejemplo, podría decir "Muéstrame el satélite meteorológico" o simplemente "Mostrar satélite".

(?:satélite|nubes) significa que el usuario tiene que decir "satélite" o "nubes" en la frase para que se detecte la frase.

(?:.*?)? significa que de nuevo buscamos cualquier número de palabras opcionales.

(?:para |de |en )? significa que buscamos "para" o "de" o "en" para que el usuario pueda decir "Mostrar el satélite para Colorado". Poniendo el ? al final significa que esto es opcional.

(.*?)? significa que buscamos una palabra o grupo de palabras opcionales más al final. Pero esta vez no ponemos ?: al principio dentro de los paréntesis () porque queremos recordar el partido para usarlo más tarde. Queremos recordar la última palabra de un comando hablado como "Muéstrame el satélite meteorológico de Londres ". Entonces la coincidencia recordada se puede usar en la acción: https://weather.weatherbug.com/maps/$1 . Él $1 se reemplazará con Londres en la URL. $1 se utiliza para el primer partido y $2 para el segundo, etc. Si quisiera poner todo el comando hablado en la acción, entonces usaría $0 . Como ejemplo, si quisieras dejar que Google decida cómo reproducir música por ti, entonces podrías usar esta frase: Reproducir (.*?) . Entonces, el comando hablado podría ser "Play Coldplay". Y la acción podría ser: http://www.google.com/search?btnI&q=$0 porque el $0 coincidiría con la frase completa "Play Coldplay", por lo que se enviaría a Google como: http://www.google.com/search?btnI&q=Juega a Coldplay . btnI significa usar instantáneamente el botón Me siento afortunado, por lo que Google usaría el primer resultado, que probablemente sería un video de Youtube.

Macros de registros médicos y autotexto

Estos son algunos ejemplos de cómo los profesionales médicos pueden usar Speech Recognition Anywhere para crear comandos personalizados para macros de registros médicos o autotexto.

Frase: Erupción negativa|Rash negativo
Acción: Erupción no preocupante para sarna, sarampión, meningococemia, varicela, trastorno ampolloso, síndrome de Stevens-Johnson, necrólisis epidérmica tóxica, síndrome de piel escaldada por estafilococos o herpes diseminado. No hay evidencia de eritema multiforme, Lyme, celulitis, fascitis necrosante, meningococemia, fiebre maculosa de las montañas rocosas.
Descripción: Diga "Erupción negativa" o "Rash negativo"

Aquí hay un ejemplo de una frase corta que puede decir para un examen médico y hacer que escriba una descripción detallada:

Frase: Prueba de la enfermedad de Lyme|Prueba de anticuerpos de Lyme
Acción: ENFERMEDAD DE LYME IGG/IGM, según lo recomendado por la Administración de Alimentos y Medicamentos (FDA), todas las muestras con resultados positivos o equívocos en el EIA (detección) de anticuerpos contra Borrelia burgdorferi se analizarán mediante Western Blot.
Descripción: Diga "Prueba de la enfermedad de Lyme" o "Prueba de anticuerpos de Lyme"

Texto a voz

La extensión Speech Recognition Anywhere Chrome también tiene capacidades de texto a voz. Este es un ejemplo de un comando personalizado para convertir a Wolfram Alpha en un asistente virtual parlante con reconocimiento de voz.

Frase: Wolfram\s*Alfa,? (.*?)
Acción: http://www.wolframalpha.com/input/?i=$1;speak_element(img._3c8e[1])
Descripción: Wolframio Alfa Pregunta

La frase anterior incluye \s* entre Wolfram y Alpha porque a veces la Web Speech API de Google detecta la frase como "Wolfram Alpha" y otras veces como "WolframAlpha". Este comando aceptará ambos. La Acción es en realidad un guión. Cada comando de script está separado por ; (punto y coma). La primera acción en el script va al sitio web de wolframalpha con la cadena de entrada que se dijo. Por ejemplo, diga "Wolfram Alpha ¿Cuándo sale la próxima luna?". La siguiente acción en el script le dice a Speech Recognition Anywhere que hable en voz alta con un elemento de texto a voz en la página web. El elemento es un img etiqueta con class="_3c8e" . Wolfram Alpha pone el resultado en una imagen en lugar de texto sin formato. Pero esa imagen tiene un alt atributo con una respuesta de texto sin formato a la pregunta. Asi que img._3c8e[1] lee en voz alta el segundo o [1] img etiqueta con class="_3c8e" .

Aquí hay otro ejemplo de un comando personalizado de texto a voz que crea un Tomador de decisiones:

Frase: Debería (.*?)
Acción: say(Sí|No|Definitivamente sí|Absolutamente no|Probablemente no)
Descripción: Tomador de decisiones

Él say El comando leerá en voz alta cualquier texto que coloque allí. el | o tubería (también llamada barra vertical) separa cada texto para leer como un OR . El comando decir elegirá aleatoriamente una de las respuestas para leer en voz alta. Ahora haga cualquier pregunta que comience con "¿Debería...?"

secuencias de comandos

En el campo Acción de los comandos personalizados, puede crear un script de acción. Cada comando se separa con un ; (punto y coma). Aquí hay un ejemplo:

Acción: http://example.com/;scroll_it(down);click_element(search);speak(answer)

El script de acción anterior irá primero a example.com . Luego se desplazará hacia abajo en la página, luego haga clic en un elemento con una id de search y luego diga en voz alta el texto en un elemento con una id de answer .

Scripting Commands

;	Separe cada comando en el campo Acción con ;
;;	Pausa por 1 segundo. (Cada comando está separado por medio segundo, por lo tanto, para hacer una pausa de 1 segundo, use dos puntos y comas.
%3B	para imprimir un ; en la pantalla, use la versión codificada de URL (codificada en porcentaje) que es %3B
%28 %29	Para imprimir paréntesis () usar %28 y %29 respectivamente.
\btexto\b	Si la frase comienza y termina con \b , el texto se reemplazará con el texto en el campo de acción. Por ejemplo: para reemplazar paréntesis abierto con ( use: Frase: \bparéntesis abierto\b Acción: ( Descripción: Siempre reemplace: "paréntesis abierto" con "("
add_labels(opción)	Agregue etiquetas a los botones que son solo imágenes. la opción puede ser show o hide .
add_numbers(opción)	Agregue números a enlaces, botones y entradas. la opción puede ser show o hide .
backspace(X)	Presione la tecla de retroceso. Donde x es la cantidad de veces que se presiona. El valor predeterminado es 1.
browse(opción)	Navegar por el historial del navegador. la opción puede ser back, forward, reload, refresh . Ejemplo para crear un comando para Regresar en el historial del navegador en español: Frase: retroceder Acción: browse(back) Descripción Navegar hacia atrás en español
capitalize_first_letter(texto, todas_palabras)	Convierta la primera letra del texto en mayúscula. Si todas_palabras es true luego, cada primera letra de cada palabra en el texto se convertirá a mayúscula. El valor predeterminado es false . Por ejemplo: Frase: mayúscula (.?)* Acción: capitalize_first_letter($1, true) Descripción: Di "Hello world" en mayúsculas para imprimir "Hello World"
clear_text()	Borra todo el texto en la entrada o área de texto actualmente seleccionada.
click_element(el)	el puede ser el id de un elemento para hacer clic o si el elemento no tiene un id entonces puede ser una etiqueta debajo de un elemento. Por ejemplo, si el es results.img[0] entonces el click_element comando hará clic en el primer (0) img debajo del elemento con id de "results" .
click_keyword(el)	el puede ser el id de un elemento para hacer clic o el name, text, title, aria-label o alt de un elemento para hacer clic.
clipboard(opción)	la opción puede ser copy, cut, paste
dictation(opción)	Active o desactive el dictado (voz a texto). la opción puede ser on, off, start, stop . (Solo disponible en la Versión Completa)
enter_key(x)	Pulse la tecla Intro. Donde x es la cantidad de veces que se presiona. El valor predeterminado es 1.
escape_key(x)	Pulse la tecla de escape. Donde x es la cantidad de veces que se presiona. El valor predeterminado es 1.
find_phrase(palabras clave)	Busque una palabra o frase en la página y resáltela o selecciónela. Por ejemplo, para crear un comando personalizado para buscar una palabra o frase en español como "Buscar restaurante": Frase: (?:búsqueda \|buscar )(?:de \|para )?(.?)* Acción: find_phrase($1) Descripción: Buscar en Español
https://	Inicie un comando en el campo Acción con http:// , https:// , ftp:// , file:/// para ir a ese sitio web o archivo. Por ejemplo: https://seabreezecomputers.com cambiará la ubicación actual a seabreezecomputers.com
insertHTML(html)	Previamente cualquiera html en el campo de acción se imprimiría como HTML . Ahora se imprimirá como texto desde la versión 1.4.4 (5/3/2021). Para imprimir html ahora use el insertHTML() función en el campo de acción: Frase: salto de línea Acción: insertHTML(<br>) Descripción: Decir salto de línea para insertar html: <br>
insertText(texto)	Para imprimir fácilmente texto en la pantalla incluyendo < > ( ) ; Luego pon el texto en el insertText() dominio. Normalmente, las etiquetas html < > no se imprimirán y ( ); son caracteres especiales reservados en el campo Acción. Pero si pones los personajes en insertText() entonces se imprimirán bien en la pantalla. Ejemplo: Acción: insertText(<div onclick="alert('Hello');">)
keypress(n, ctrl, alt, shift)	Para páginas web que escuchan pulsaciones de teclas. Dónde n es el keyCode de la tecla a pulsar. Por ejemplo: keypress(49) presionará el 1 llave. Ver Tabla de códigos clave . O n puede ser la letra para presionar comokeypress(z). Ejemplo para enviar ALT+Z : keypress(z, false, true) ; Ejemplo para enviar CTRL+Z : keypress(z, 1); Si n es una cadena, entonces la cadena se convertirá en pulsaciones de teclas en el sitio web. Por ejemplo: keypress(zebra) ; enviará eventos de pulsación de teclas para z,e,b,r,a .
moveCursor(dirección, x, opción)	Mueva el cursor en la dirección de arriba, abajo, izquierda, derecha, arriba, abajo, inicio, final. x es el número de veces que hay que moverse en esa dirección. El valor predeterminado es 1. La opción puede ser carácter, palabra, oración, párrafo, documento, papel, cuadro, texto o campo. El valor predeterminado es palabra.
open(sitio web, nombre_de_la_pestaña)	Abra el sitio web en la pestaña nombre_de_la_pestaña . Este comando se utiliza para abrir siempre en la misma pestaña. Si la pestaña nombre_de_la_pestaña ya está abierta, permanecerá en segundo plano si no es la pestaña activa. Si no se proporciona nombre_de_la_pestaña , este comando siempre abrirá una nueva pestaña.
play(palabras clave, nueva_pestaña)	Reproduzca una canción o un video con palabras clave usando el botón Me siento afortunado de Google. El valor predeterminado para nueva_pestaña es false . Aquí hay un ejemplo de un comando personalizado para reproducir música o un video en español: Frase: (?:Toca\|Juega) (.?)(?: ?)?(?:en )?(?:una )?(nueva pesta[nñ]a)? Acción: play($1, $2) Descripción: play() en español. Di "Toca (música) (en una nueva pestaña)"
print_text(texto)	Para imprimir fácilmente texto en la pantalla incluyendo < > ( ) ; Luego pon el texto en el print_text() dominio. Normalmente, las etiquetas html < > no se imprimirán y( ) ;son caracteres especiales reservados en el campo Acción. Pero si pones los personajes en print_text() entonces se imprimirán bien en la pantalla. Ejemplo: Acción: print_text(<div onclick="alert('Hello');">) print_text() es sinónimo de insertText() .
read(opción)	Leer en voz alta con texto a voz. la opción puede ser all\|everything\|page\|webpage\|paragraph\|screen\|article\|website\|site\|main\|content\|main content\|alert\|notification\|status buttons\|inputs\|links\|hyperlinks\|web links\|images\|figures\|headings\|titles\|headlines menu\|navigation\|header\|banner\|footer\|contentinfo\|sidebar\|aside\|complementary\|toolbar selection\|selected\|highlighted
redo(X)	Rehacer el último texto que se deshizo con deshacer. x es el número de veces que se debe rehacer. El valor predeterminado es 1.
replace_word(texto)	Reemplazar una palabra en una oración con texto . Por ejemplo: Para reemplazar "ok" with "okay" use: Phrase: ok Action: replace_word(okay) Description: Always replace "ok" with "okay"
say(texto)	Habla en voz alta con texto a voz.
script(código)	Puede incluir secuencias de comandos avanzadas en el código mediante el comando de secuencia de comandos. Usar return variable al final para que la variable se muestre en el área de texto. Por ejemplo, aquí hay un script de comando personalizado para mostrar la fecha de hoy en formato en-US: Frase: (Escriba \|Ingrese )?fecha de hoy Acción: script(var today = new Date().toLocaleDateString('en-US'); return today;) Descripción: Diga 'Ingrese la fecha de hoy' o 'Escriba la fecha de hoy' o 'Fecha de hoy'
scroll_it(dirección)	Desplácese por la página. la dirección puede ser arriba, abajo, derecha, izquierda, arriba o abajo. También puede incluir un tipo de elemento con la dirección separada por una coma. El tipo de elemento puede ser body, page, menu, navigation, sidebar or box. Por ejemplo: scroll_it(menu, down) desplazará un menú en la página hacia abajo. scroll_it(box) por defecto, desplazará un cuadro de texto en la página hacia abajo.
scrollToPosition(el)	Desplácese hasta el elemento HTML si no está a la vista. el debería ser el id del elemento
select(opción)	la opción puede ser all o none . Seleccione todo el texto o nada de texto en la entrada o área de texto seleccionada actualmente o en la página. Algunas áreas de texto en algunos sitios web también permiten que la opción sea carácter, letra, palabra, oración, párrafo. Estas áreas de texto también pueden tener múltiples opciones separadas por una coma que incluye una dirección o la cantidad. Por ejemplo select(last, 3, words) seleccionará las 3 palabras anteriores detrás del cursor. Otro ejemplo, select(next, 2, sentences) seleccionará las siguientes 2 oraciones delante del cursor. select(sentence) seleccionará la frase anterior.
set_language(idioma)	Establezca el idioma de reconocimiento de voz en idioma temporalmente. Se puede ver una lista desplegable de idiomas en el menú "Configuración" de Speech Recognition Anywhere.
spacebar(X)	Presiona la barra espaciadora. Donde x es la cantidad de veces que se presiona. El valor predeterminado es 1.
speak_element(el)	Leer o hablar en voz alta el contenido de un elemento. Leerá el innerText, alt, aria-label or title atributo del elemento. el puede ser un selector como usando querySelectorAll en JavaScript con una [n] opcional para especificar qué elemento de la matriz leer. Por ejemplo: para leer el resultado de WolframAlpha use speak_element(img._3c8e[1]); El elemento es una etiqueta img con class="_3c8e" . Wolfram Alpha pone el resultado en una imagen en lugar de texto sin formato. Pero esa imagen tiene un alt atributo con una respuesta de texto sin formato a la pregunta. Asi que img._3c8e[1] lee en voz alta la segunda o [1] etiqueta img con class="_3c8e" .
submit_form()	Envíe el formulario actual en el sitio web.
switch_fields(opción)	Cambiar campos en un formulario o cambiar enlaces. La opción puede ser siguiente, anterior, palabra clave como el name o id de un elemento de formulario o el número en orden del elemento de formulario/enlace en la página.
switch_tabs(opción)	Cambia las pestañas del navegador. la opción puede ser siguiente, anterior, cerrar, último, primero, número de pestaña, título o URL de la pestaña. Aquí hay un ejemplo de un comando personalizado para español para cambiar de pestaña: Frase: Cambiar (?:a )?(?:la )?(.?)? ?pesta[nñ]as? ?(.?)? Acción: switch_tabs($1$2) Descripción: Cambiar de pestaña en español. Di "Cambiar a la siguiente pestaña" o "Cambiar a la pestaña anterior".
texto	Escriba texto en la página en la entrada o área de texto seleccionada actualmente o elegirá la primera entrada disponible en la página
.toUpperCase()	La manipulación de cadenas Javascript ahora se puede usar como toUpperCase() . Aquí hay un ejemplo de un comando personalizado para hacer que el discurso se hable en mayúsculas o en mayúsculas: Frase: (?:mayúsculas\|todas las mayúsculas) (.?)* Acción: $1.toUpperCase() Descripción: Diga "mayúsculas hola mundo" para imprimir "HOLA MUNDO"
undo(X)	Deshacer el último comando de texto. x es el número de veces para deshacer. El valor predeterminado es 1. Aquí hay un ejemplo de cómo traducir un comando de deshacer al español: Frase: Deshacer(?: ?)(\S?)?(?: ?)(veces)?$* Acción: undo($1) Descripción: Deshacer() en español. Di "Deshacer" o "Deshacer (Número) veces"
url(sitio web, nueva_pestaña, enfocado)	Cambiar ubicación a sitio web . El valor predeterminado para nueva_pestaña es false. El valor predeterminado para enfocado es true . Si enfocado se establece en false entonces la pestaña permanecerá en segundo plano. Sólo hay que poner url() sin parámetros para abrir una nueva pestaña. Aquí hay un ejemplo de un comando personalizado para visitar un sitio web en español: Frase: ¿Visita[a]r? (.?\.\s?\S{2,6})(?: ?)?(?:en )?(?:una )?(nueva pesta[nñ]a)? Acción: url($1, $2) Descripción: url() en Español. Di "Visita google punto com (en una nueva pestaña)" nueva_pestaña también puede ser el nombre de una pestaña para que se reutilice una pestaña si el nombre es el mismo. nueva_pestaña también puede ser una URL. Si nueva_pestaña es una URL, buscará si hay una pestaña que comience con esa URL y la usará; de lo contrario, creará una nueva pestaña. Por ejemplo, aquí hay un comando personalizado que buscará una pestaña que comience con https://www.youtube.com/ cuando un usuario diga "nombre de la canción de YouTube" y usará esa pestaña si existe: Frase: (YouTube) (.?)* Acción: url(https://www.google.com/search?btnI&q=youtube $2, https://www.youtube.com, true) Descripción: "Reproducir (título de la canción o video)" usando Youtube

Reconocimiento de voz en cualquier lugar

Escriba correos electrónicos con su voz
Escribe documentos con tu voz
Controla Internet con tu voz
Extensión de Chrome

Volver a www.seabreezecomputers.com

f Compartir
0

Compartir G+
0

Twittear
0

en Compartir
0

P en eso
0

Reconocimiento de voz en cualquier lugar

Escriba correos electrónicos con su voz
Escribe documentos con tu voz
Controla Internet con tu voz
Extensión de Chrome

Comentarios del usuario

Hay 750 comentarios.

Mostrando los primeros 50 comentarios.

1. Publicado por: Jeff - - 11 de diciembre de 2016, 1:44 p. m.

Descripción: Mostrar el satélite meteorológico (para Nueva York)

Frase: (?:Mostrar|Mostrar)(?:.*?)?(?:satélite|nubes)(?:.*?)?(?:para |de | en )?(.*?)?

Acción: https://weather.weatherbug.com/maps/$1?layerId=GlobalSatellite

Jeff
www.seabreezecomputers.com/

2. Publicado por: Jeff - - 11 de diciembre de 2016 a las 14:25

Frase: (?:Mostrar|Mostrar)(?:.*?)?(?:luna)(?:.*?)?(fase)?

Acción: http://api.usno.navy.mil/imagery/moon.png

Descripción: Puedes decir: "Muéstrame la luna" o "Mostrar la fase lunar actual"

Jeff
www.seabreezecomputers.com/

3. Publicado por: Jeff - - 13 de diciembre de 2016 a las 14:26

Frase: (?:Mostrar|Mostrar)(?:.*?)?(?:lluvia|radar)(?:.*?)?(?:para |de |en )?(.*?)?
Acción: https://weather.weatherbug.com/maps/$1?layerId=Radar.US

Descripción: Mostrar el radar (para Nueva York)

4. Publicado por: Jeff - - 13 de diciembre de 2016 a las 14:39

Frase: (?:Mostrar|Mostrar)(?:.*?)?(?:tráfico)(?:.*?)?(?:para |de |en )?(.*?)?

Acción: https://www.google.com/maps/place/$1/data=!5m1!1e1

Descripción: Muéstrame el tráfico (para Los Ángeles)

5. Publicado por: emin - - 18 de febrero de 2017 a las 15:38

Necesito idioma turco

6. Publicado por: Jeff - - 19 de febrero de 2017 a las 17:28

Para cambiar el idioma de reconocimiento de voz a turco, en Speech Recognition Anywhere, haga clic en "Configuración" y luego en "Idioma" puede seleccionar "Turco".

Jeff
www.seabreezecomputers.com/

7. Publicado por: Jeff - - 25 de febrero de 2017 a las 19:11

Controle las luces Philips Hue

1. Vaya a www.meethue.com/api/nupnp para obtener la dirección IP de su Hue Bridge.
2. Vaya a http://<bridge ip address>/debug/clip.html/debug/clip.html
3. Para url ingrese: /api para el cuerpo del mensaje ingrese: {"devicetype":"jeff"}
Donde jeff es el nombre de usuario que desea crear.
4. Presione POST
5. Recibirá el mensaje "Botón de enlace no presionado". Así que presiona el botón de enlace grande y redondo en la parte superior de tu Hue Bridge.
6. Presione POST nuevamente.
7. Esta vez obtienes un hash de nombre de usuario similar a 1028d66426293e821ecfd9ef1a0731df. Guarde el hash del nombre de usuario para futuras solicitudes.

A continuación, cree un comando personalizado en Speech Recognition Anywhere:

Frase: ¿Activar (encender)? (el)? ¿luz(es) de la sala de estar?(encendida)?
Acción:

http://<bridge ip address>/debug/clip.html;clear_text();/api/<username hash>/lights/1/state;click_keyword(messagebody);{"on":true};click_keyword(put)

8. Publicado por: Jeff - - 6 de marzo de 2017, 7:33 p. m.

Descripción: Youtube (cualquier video)

Frase: Youtube (.*?)

Acción: https://www.youtube.com/results?search_query=$1;click_element(thumbnail)

Jeff
www.seabreezecomputers.com/

9. Publicado por: Jeff - - 15 de marzo de 2017 a las 14:32

Descripción: "Reproducir (título de la canción o video)" con youtube

Frase: ^Play (.*?)$

Acción: http://www.google.com/search?q=youtube $0;click_element(res.a[0])

Jeff
www.seabreezecomputers.com/

10. Publicado por: Jeff - - 7 de abril de 2017 a las 21:23

Descripción: ¿Cuál es el índice UV en Nueva York ?

Frase: (?:Qué|Mostrar|Mostrar)(?:.*?)(?:Índice UV)(?:.*?)?(?:para |de |en )?(.*?)?

Acción: http://sunburnmap.com/;;;;;clear_text();$1;click_keyword(find)

Jeff
www.seabreezecomputers.com

11. Publicado por: Raymond - - 12 de junio de 2017, 12:48 p. m.

No soy programador, así que necesito ayuda. Quiero poder cambiar el reconocimiento de voz de inglés a español y viceversa. ¿Hay un script que pueda usar para esto? Cualquier ayuda será muy apreciada

20 de junio de 2017 - Del Editor:
La versión 0.98.8 ahora tiene el comando de voz incorporado "Cambiar el idioma a español o inglés"

12. Publicado por: Paul LaZar - - 4 de julio de 2017, 10:22 am

Acabo de comprar e instalar su software de voz. Lo instalé en una tableta Windows con Windows 10 home (versión completa).

Mi único interés en su software es habilitar OK Google, lo cual hice y está funcionando. El problema es OK, Google responde y me saca de la página web. Un ejemplo:

"OK, Google, navegue a DC", aparece la página del mapa con la ruta que se muestra y Google dice "navegando a DC" y la página va a otro lugar.

He intentado esto de varias maneras haciendo preguntas, etc. y cada vez que Google habla, su software lo interpreta y escribe nuevas páginas.

Por favor avise.

13. Publicado por: Jeff - - 4 de julio de 2017 a las 14:49

Hola Paul Lazar,

Lamento el problema que estás teniendo. Es porque el micrófono está captando el discurso de sus altavoces. Intente esto, en Reconocimiento de voz en cualquier lugar, haga clic en Configuración y luego marque Pausar "Reconocimiento de voz en cualquier lugar" si el audio se está reproduciendo en una pestaña . Creo que eso debería resolver el problema.

Jeff
www.seabreezecomputers.com/

14. Publicado por: Lola - - 26 de julio de 2017 a las 4:09 am

¿Hay alguna forma de evitar que el texto aparezca en la esquina superior izquierda antes de que se escriba en el cuadro de diálogo? Además, ¿hay alguna manera de detener el resaltado amarillo y el desplazamiento cuando se ingresa texto?

15. Publicado por: Jeff - - 26 de julio de 2017 a las 11:36

Hola Lola,

No hay forma de evitar que aparezca el texto antes de escribirlo en el cuadro. Así es como los usuarios saben que el reconocimiento de voz está escuchando lo que dicen. No estoy seguro de a qué te refieres con el resaltado amarillo y el desplazamiento. ¿Tiene un sitio web de ejemplo y un cuadro donde esto está sucediendo?

Jeff
www.seabreezecomputers.com/

16. Publicado por: buen software, pero no funciona del todo en un sitio - - 1 de agosto de 2017, 11:30 am

Buen software, justo lo que estoy buscando, pero desafortunadamente no funciona para mí en ankiweb.net. Este sitio muestra un enlace en el que hago clic repetidamente para escuchar indicaciones de voz. Cuando trato de hacer esto usando SRE, la grabación comienza a reproducirse, pero luego obtengo un 404. Tengo problemas para obtener la fuente de la página, pero creo que lo que sucede es que la grabación se reproduce mediante un fragmento de JavaScript. que está conectado al enlace como un atributo onClick. La ubicación especificada por el enlace no existe realmente, por lo que, por ejemplo, si hago clic con el botón derecho en el enlace y copio el destino en el portapapeles e intento cargarlo en otra página, de hecho obtengo un 404. Pero si haga clic manualmente en el enlace, funciona según lo diseñado, es decir, reproduce la grabación de voz y no intenta ir a otra página.

Así que no estoy seguro de la desconexión aquí y, lamentablemente, no podrá reproducir fácilmente sin mis credenciales. Si quieres continuar, te daré mis credenciales (y $150 si haces que esto funcione en ankiweb).

17. Publicado por: Paul LaZar - - 2 de agosto de 2017, 9:44 am

Gracias por la información Jeje.

18. Publicado por: Jeff - - 2 de agosto de 2017, 9:46 am

Hola Nelson,

creo que lo descubrí. ankiweb.net tiene otro elemento superpuesto al enlace "Reproducir" con un evento de clic de javascript adjunto. Entonces, para usar su voz y decir "Haga clic en Reproducir", agregue este comando personalizado a Speech Recognition Anywhere:

Frase: Haga clic en Reproducir
Acción: click_element(jp_container_1)

O, si lo desea, puede reemplazar "Hacer clic en Reproducir" en la frase anterior con "Presione Jugar".

Jeff
www.seabreezecomputers.com/

19. Publicado por: buen software, pero no funciona del todo en un sitio - - 2 de agosto de 2017, 9:48 am

Buen trabajo, Jeff, esto funciona para mí.

20. Publicado por: Kim V - - 16 de agosto de 2017, 13:31

Hola. Debe hacer una opción para ocultar las etiquetas al hablar. Son muy molestos cuando no se usan, y sigue intentando detectar lo que estoy diciendo.

Otra cosa que sería genial es deshabilitar la voz a texto y solo hacer que funcione con comandos.

21. Publicado por: Jeff - - 17 de agosto de 2017 a las 11:26

Hola Kim,

¡Gracias por las sugerencias! Me gusta la idea de poder deshabilitar la voz a texto y que solo funcione con comandos. Pero no estoy tan seguro de ocultar las etiquetas al hablar. Creo que la mayoría de las personas estarían confundidas y pensarían que el reconocimiento de voz no funciona porque no mostraría señales de que funciona hasta después de que terminen de hablar. Déjame pensarlo y ver qué puedo hacer.

Jeff
www.seabreezecomputers.com/

22. Publicado por: Jeff - - 21 de agosto de 2017, 7:00 p. m.

Hola, Kim V:

En la versión 0.98.9 de Speech Recognition Anywhere, agregué las siguientes tres configuraciones:
* Deshabilitar la burbuja de diálogo amarilla (solo se mostrará el discurso final)
* Deshabilitar Speech-To-Text (solo funcionarán los comandos de voz)
* Deshabilitar los comandos de voz (Solo funcionará Speech-To-Text)

Espero que funcione para usted.

Jeff
www.seabreezecomputers.com/

23. Publicado por: Kim V - - 22 de agosto de 2017, 12:35 p. m.

Hola Jeff.

¡Usted es maravilloso! Es bueno ver sugerencias entrar en el producto final :)

24. Publicado por: Jeff - - 4 de septiembre de 2017, 9:32 am

Hola Samuel Cartaxo,

Gracias por avisarme del error. Algunas personas obtienen el error y otras no. Pero Google parece no estar haciendo nada al respecto. ¿Con qué frecuencia obtiene el error?

Jeff
www.seabreezecomputers.com/

25. Publicado por: thomas - - 28 de septiembre de 2017 a las 11:18

¡Hola!
Tengo curiosidad por saber qué está usando internamente para ASR y TTS.
¿Está utilizando la API de voz de Google o herramientas integradas específicas del navegador de Chrome?
¡Gracias!
-tomás

26. Publicado por: Jeff - - 28 de septiembre de 2017, 12:39 p. m.

Hola, Thomas,

el reconocimiento de voz en Speech Recognition Anywhere se logra con la API Web Speech de Javascript, que en este momento solo funciona bien en Chrome.
Consulte: developer.mozilla.org/en-US/docs/Web/API/Web_Speech_API

TTS se logra con Web Speech API SpeechSynthesis. Parece funcionar con Chrome, Firefox, Edge y Safari, pero no con IE.
Consulte: developer.mozilla.org/en-US/docs/Web/API/SpeechSynthesis

Jeff
www.seabreezecomputers.com/

27. Publicado por: whelb5050 - - 10 de noviembre de 2017, 7:50 am

¿Funcionará esto con el navegador Chromium? Tengo un proyecto que involucra una Raspberry Pi y me gustaría abrir páginas web y navegarlas con voz.

28. Publicado por: Jeff - - 10 de noviembre de 2017 a las 10:22

Hola, whelb5050,

creo que funcionará con el navegador Chromium. Pero no tengo idea si funcionará con Raspberry Pi. ¿Puedes probarlo y avisarnos?

Jeff
www.seabreezecomputers.com/

29. Publicado por: bodyalive - - 11 de noviembre de 2017, 9:27 am

¿Hay alguna manera de desactivar el filtro de blasfemias? Gracias.

30. Publicado por: Markey - - 11 de noviembre de 2017, 9:55 am

Por alguna razón, esta extensión no funciona en el chat de Facebook (la ventana de chat se cierra sin ningún motivo, la voz a texto funciona bien). ¿Alguna ayuda?

31. Publicado por: whelb5050 - - 11 de noviembre de 2017 a las 12:57 p. m.

Prueba exitosa en la Raspberry Pi. Esto salvó nuestro proyecto escolar del fracaso.

32. Publicado por: Jeff - - 11 de noviembre de 2017 a las 12:58 p. m.

Hola whelb5050,

¡Es bueno escuchar eso! Me alegro de que haya funcionado. Gracias por hacernos saber.

Jeff
www.seabreezecomputers.com/

33. Publicado por: Jeff - - 11 de noviembre de 2017 a las 13:13

Hola bodyalive,

puedes intentar filtrar las blasfemias con un comando personalizado como el siguiente. Sin embargo, no estoy seguro de qué tan bien funcionará:

Frase: (.*?)(mala|palabra|lista)(.*?)
Acción: $1$3

Jeff
www.seabreezecomputers.com/

34. Publicado por: Jeff - - 11 de noviembre de 2017, 1:25 p. m.

Hola Markey,

he duplicado el problema. Parece que Facebook podría tener algún tipo de bloqueo para evitar que el malware o los virus envíen mensajes sin el permiso del usuario. Me di cuenta de que si escribo un espacio primero en el cuadro de chat de Facebook, aceptará Speech Recognition Anywhere. Pero decir "Presione enter" o "Enviar" no envía el mensaje. Tienes que presionar manualmente la tecla enter.

Jeff
www.seabreezecomputers.com/

35. Publicado por: bodyalive - - 12 de noviembre de 2017, 4:07 am

CITA "

Puede intentar filtrar las blasfemias con un comando personalizado como el siguiente. Sin embargo, no estoy seguro de qué tan bien funcionará:

Frase: (.*?)(malo|palabra|lista)(.*?)
Acción: $1 $ 3 "

LO SIENTO, esto no funcionó,
sé cómo evitar que la voz a texto de Android bloquee las malas palabras, me pregunto si también hay una forma de desactivar la censura en Chrome.

36. Publicado por: Jeff - - 13 de noviembre de 2017 a las 11:22

Hola bodyalive,

Lo siento, leí mal tu mensaje. Pensé que querías bloquear las blasfemias.

La API de voz web en Chrome solía no filtrar las blasfemias, pero ahora lo hace. Pero no puedo encontrar ninguna configuración sobre cómo evitar que filtre blasfemias. Puede probar el siguiente comando personalizado, pero tendría que crear un comando separado para cada palabrota:

Frase: (.*?)(s\*+)(.*?)
Acción: $1ship$3

Reemplace la s en el frase con la primera letra de la palabrota para cada comando personalizado.

Jeff
www.seabreezecomputers.com/

37. Publicado por: bodyalive - - 15 de noviembre de 2017, 9:02 am

Jeff esto hizo el truco!

Dado que algunas "malas palabras" comparten la misma primera letra, tuve que usar (.*?)(1 stlelette\*{n})(.*?) para especificar una de otra.

gracias.

38. Publicado por: whelb5050 - - 15 de noviembre de 2017 a las 12:56 p. m.

¿Qué tan bien maneja esta extensión los nombres de las personas? Por ejemplo, estoy creando un directorio para nuestros profesores universitarios. Me gustaría mostrarle al Dr. John Doe y que obtenga su información de contacto, sin embargo, algunos de los nombres de los profesores son bastante difíciles de pronunciar.

39. Publicado por: Jeff - - 15 de noviembre de 2017 a las 12:59 p. m.

Hola bodyalive, ¡

Gracias por avisarnos! Me alegro de que haya funcionado. Parece que conoces algunas expresiones regulares. ¡Buen trabajo!

Jeff
www.seabreezecomputers.com/

40. Publicado por: Jeff - - 15 de noviembre de 2017 a las 14:00

Hola, whelb5050.

El reconocimiento de voz parece funcionar muy bien con los nombres comunes. Dr. John Doe trabaja bien y muchos otros nombres comunes. Para nombres poco comunes, si se equivoca, puede intentar crear un comando personalizado. Por ejemplo, aquí hay una ortografía poco común de un nombre: "Alexus Rodrigues". Si digo ese nombre, el reconocimiento de voz imprime la ortografía común de "Alexis Rodríguez". Entonces, asumiendo que no tengo un Alexis Rodríguez en la base de datos, podría crear este comando personalizado:

Frase: Alexis Rodríguez
Acción: Alexus Rodrigues

Espero que ayude,

Jeff
www.seabreezecomputers.com/

41. Publicado por: Maicon - maiconpinheiro@zoho.com - 18 de noviembre de 2017, 9:40 p. m.

la opción de compra en la tienda de aplicaciones de Chrome está atenuada y no puedo comprarla. ¿Pueden ayudarme?

42. Publicado por: Jeff - - 19 de noviembre de 2017, 11:11 a. m.

Hola Maicon,

no sé por qué, pero parece que Chrome Web Store bloquea la compra en algunos países. Algunos usuarios han tenido éxito al hacer clic en el botón Configuración en Chrome Web Store y cambiar su país a uno de los países admitidos. Consulte: developer.chrome.com/webstore/pricing

Otros usuarios han tenido éxito al usar un servicio VPN como HotSpot Shield (también una extensión de Chrome) para cambiar su país temporalmente.

Jeff
www.seabreezecomputers.com/

43. Publicado por: Maicon - maiconpinheiro@zoho.com - 20 de noviembre de 2017, 6:44 p. m.

¡Gracias! He logrado comprar con éxito. Por cierto, ¿conocen un comando personalizado para reproducir música en YouTube, mejor que usar el motor de búsqueda de Google? a veces no reproduce la canción, sino una versión.

44. Publicado por: JohnS - - 20 de noviembre de 2017, 8:10 p. m.

¿Cómo controlamos las mayúsculas? En Windows Voice Rec, utilice los resultados en MAYÚSCULAS en PALABRA; Ponga en mayúsculas los resultados en Word, lo mismo para minúsculas y NoCaps. No puedo hacer que SR Anywhere haga esto.
Además, cómo controlar el número 1 frente a la palabra o trece frente a 13 o mil ochenta y siete frente a 1087.
Puede ser mi forma de hablar, pero si digo "y" solo, el software me lleva al final de la línea pero si digo "fueron y" funciona bien.
He procesado alrededor de 1000 líneas hasta ahora y estos son desafíos para mí. Funciona muy bien por lo demás, los nombres son fantásticos.

45. Publicado por: JohnS - - 20 de noviembre de 2017 a las 20:54

Otra cosa que he notado, la palabra "O'CLOCK" cuando se pronuncia, aparece la palabra "OK" pero no imprime nada.

46. Publicado por: Jeff - - 21 de noviembre de 2017, 11:39 am

Hola Maicon,

¿Has probado los comandos personalizados en los comentarios 8 y 9 para reproducir música? Es posible que pueda encontrar una variación de uno de esos comandos.

Jeff
www.seabreezecomputers.com/

47. Publicado por: Jeff - - 21 de noviembre de 2017 a las 11:55

Hola JuanS,

gracias por tus comentarios. Speech Recognition Anywhere utiliza la Web Speech API integrada en Chrome, por lo que lamentablemente estamos un poco limitados por las capacidades que Google ha programado en el reconocimiento de voz.

La API Web Speech de Google no parece tener un comando "todo en mayúsculas" o "mayúsculas", por lo que tendría que programarlo yo mismo para tener esa capacidad.

En cuanto a números. A Google parece gustarle convertir la mayoría de los números en números en lugar de palabras. Probablemente porque están asumiendo que las personas están completando formularios o configurando eventos o recordatorios en el calendario.

En cuanto a decir "y" llevándote al final de la línea. Programé ese comando porque, a veces, cuando decía "terminar" solo, el reconocimiento de voz pensaba que estaba diciendo "y", y no pensé que nadie diría "y" solo. Pero lo eliminaré en la próxima versión para que se imprima "y".

Jeff
www.seabreezecomputers.com/

48. Publicado por: Jeff - - 21 de noviembre de 2017 a las 11:59

Hola JohnS,

tienes razón. No me di cuenta de eso antes. La API Web Speech de Google parece no entender "en punto". Lo intenté una y otra vez. Diría "siete en punto" y simplemente imprimiría "7".

Pero encontré una solución muy extraña. Si digo "reloj de las siete" sin la "o", entonces imprime "7 en punto".

Jeff
www.seabreezecomputers.com/

49. Publicado por: Maicon - - 21 de noviembre de 2017 a las 13:43

Tengo que crear un comando para detener un video de youtube, así que intenté usar el comando para cerrar la pestaña o presionar la barra espaciadora, pero no logro que funcione, lo siento, no sé mucho sobre esas cosas. .

50. Publicado por: Jeff - - 21 de noviembre de 2017, 1:58 p. m.

Hola Maicon,

si dices "Haz clic en pausa" o "presiona pausa" en la página de youtube, entonces debería pausar el video. Pero si sus parlantes son demasiado fuertes o el micrófono está demasiado cerca de los parlantes, es posible que no lo entienda correctamente. También puede decir "Haga clic en reproducir" o "presione reproducir" para iniciar el video nuevamente.

También asegúrese de que la configuración 'Pausar "Reconocimiento de voz en cualquier lugar" si el audio se está reproduciendo en una pestaña'
no esté marcada. De lo contrario, el reconocimiento de voz no funcionará mientras se reproduce el audio.

Jeff
www.seabreezecomputers.com/

☼🌙