|
Con "Reconocimiento de voz en cualquier lugar" puedes controlar Internet con tu voz. ¡Use el reconocimiento de voz para completar entradas, áreas de texto, formularios o documentos en Internet! El discurso que pronuncia se escribe automáticamente en el formulario del sitio web. "Reconocimiento de voz en cualquier lugar" también se puede utilizar como un asistente virtual increíble. Descargue la extensión de reconocimiento de voz en cualquier lugar para Chrome o Edge hoy mismo. Un usuario puede usar comandos de voz simples para ir a sitios web o hacer clic en botones y enlaces. También funciona con Google Docs, Microsoft Word en línea, Gmail, Outlook.com y más. Los profesionales médicos lo utilizan para completar registros médicos en línea basados en la web. Los profesionales de negocios lo utilizan para dictar cartas y correos electrónicos. El usuario puede crear comandos personalizados para permitirle decir frases abreviadas que imprimen una gran cantidad de texto en un formulario.
Obtener extensión
Características
- Extensión del navegador para
Chrome o Add-on para el navegador
Edge para computadoras de escritorio y portátiles.
- Modo asistente virtual.
- Elija entre docenas de idiomas y dialectos para el reconocimiento de voz.
- Dictar correos electrónicos y documentos en línea.
- Rellena formularios con tu voz.
- Ir al campo siguiente o anterior con su voz.
- Ve a cualquier sitio web con tu voz.
- Cambia de pestaña y navega por sitios web con tu voz.
- Desplazar la página hacia arriba o hacia abajo.
- Haga clic en enlaces y botones con su voz.
- Cortar, Copiar, Pegar, Borrar, Resaltar.
- Di "Mostrar etiquetas" para ver las etiquetas de los botones en un sitio web.
- Di "Mostrar números" para ver los números junto a los enlaces y botones. Luego diga "Haga clic en (número)".
- Di "Youtube (nombre del artista o canción) (de fondo)" para reproducir música al instante.
- Cree comandos de voz personalizados.
- Texto a voz.
- Scripting.
- Puntuación automática.
- Exportar/Importar comandos personalizados.
Obtener extensión
Comandos personalizados
Busque en los comentarios a continuación los "Comandos personalizados" que puede agregar a Speech Recognition Anywhere. Si ha creado algunos comandos increíbles para Speech Recognition Anywhere, compártalos en la sección de comentarios a continuación. (Si tiene direcciones URL (http: https:) en la acción, rodéela con<code> </code>etiquetas para que el cuadro de comentarios no lo convierta en un enlace).
Para crear comandos personalizados, no necesita usar
expresiones regulares,
pero las expresiones regulares harán que sus comandos personalizados sean más potentes. Por ejemplo, podría crear este comando personalizado básico:
Frase: Mostrar el satélite meteorológico
Acción: https://weather.weatherbug.com/maps/
Descripción: Mostrar el satélite meteorológico
Pero tendría que decir la frase exacta, "Mostrar el satélite meteorológico" para que se muestre la imagen del satélite. Pero si usa expresiones regulares como en el ejemplo a continuación, puede decir varias oraciones similares para activar el comando:
Frase: (?:Mostrar|Muéstrame)(?:.*?)?(?:satélite|nubes)(?:.*?)?(?:para |de |en )?(.*?)?
Acción: https://weather.weatherbug.com/maps/$1
Descripción: Mostrar el satélite meteorológico
Con la frase anterior podrías decir "Muéstrame las nubes" o "Mostrar el satélite meteorológico de Nueva York". Aquí hay un desglose de la frase:
(?:Mostrar|Muéstrame)
significa buscar "display" o "show". Él | símbolo significa "o". Poniendo ?:
al comienzo del partido dentro de los paréntesis ()
significa buscar la coincidencia pero no recordar la coincidencia.
(?:.*?)?
significa buscar cualquier cantidad de palabras opcionales como "the" o "the weather" y no recordar la coincidencia. Él ? al final fuera de los paréntesis
() significa que estas palabras son opcionales. Por ejemplo, podría decir "Muéstrame el satélite meteorológico" o simplemente "Mostrar satélite".
(?:satélite|nubes)
significa que el usuario tiene que decir "satélite" o "nubes" en la frase para que se detecte la frase.
(?:.*?)?
significa que de nuevo buscamos cualquier número de palabras opcionales.
(?:para |de |en )?
significa que buscamos "para" o "de" o "en" para que el usuario pueda decir "Mostrar el satélite para Colorado". Poniendo el ? al final significa que esto es opcional.
(.*?)?
significa que buscamos una palabra o grupo de palabras opcionales más al final. Pero esta vez no ponemos ?: al principio dentro de los paréntesis
() porque queremos recordar el partido para usarlo más tarde.
Queremos recordar la última palabra de un comando hablado como "Muéstrame el satélite meteorológico de Londres ". Entonces la coincidencia recordada se puede usar en la acción:
https://weather.weatherbug.com/maps/$1 . Él $1 se reemplazará con Londres en la URL.
$1 se utiliza para el primer partido y $2 para el segundo, etc. Si quisiera poner todo el comando hablado en la acción, entonces usaría $0 . Como ejemplo, si quisieras dejar que Google decida cómo reproducir música por ti, entonces podrías usar esta frase: Reproducir (.*?) . Entonces, el comando hablado podría ser "Play Coldplay". Y la acción podría ser:
http://www.google.com/search?btnI&q=$0 porque el $0 coincidiría con la frase completa "Play Coldplay", por lo que se enviaría a Google como:
http://www.google.com/search?btnI&q=Juega a Coldplay .
btnI significa usar instantáneamente el botón Me siento afortunado, por lo que Google usaría el primer resultado, que probablemente sería un video de Youtube.
Macros de registros médicos y autotexto
Estos son algunos ejemplos de cómo los profesionales médicos pueden usar Speech Recognition Anywhere para crear comandos personalizados para macros de registros médicos o autotexto.
Frase: Erupción negativa|Rash negativo
Acción: Erupción no preocupante para sarna, sarampión, meningococemia, varicela, trastorno ampolloso, síndrome de Stevens-Johnson, necrólisis epidérmica tóxica, síndrome de piel escaldada por estafilococos o herpes diseminado. No hay evidencia de eritema multiforme, Lyme, celulitis, fascitis necrosante, meningococemia, fiebre maculosa de las montañas rocosas.
Descripción: Diga "Erupción negativa" o "Rash negativo"
Aquí hay un ejemplo de una frase corta que puede decir para un examen médico y hacer que escriba una descripción detallada:
Frase: Prueba de la enfermedad de Lyme|Prueba de anticuerpos de Lyme
Acción: ENFERMEDAD DE LYME IGG/IGM, según lo recomendado por la Administración de Alimentos y Medicamentos (FDA), todas las muestras con resultados positivos o equívocos en el EIA (detección) de anticuerpos contra Borrelia burgdorferi se analizarán mediante Western Blot.
Descripción: Diga "Prueba de la enfermedad de Lyme" o "Prueba de anticuerpos de Lyme"
Texto a voz
La extensión Speech Recognition Anywhere Chrome también tiene capacidades de texto a voz. Este es un ejemplo de un comando personalizado para convertir a Wolfram Alpha en un asistente virtual parlante con reconocimiento de voz.
Frase: Wolfram\s*Alfa,? (.*?)
Acción: http://www.wolframalpha.com/input/?i=$1;speak_element(img._3c8e[1])
Descripción: Wolframio Alfa Pregunta
Note: As of 12/30/2018 the latest Chrome update blocks speechSynthesis on websites
without any notification. To allow speechSynthesis on a website you will need to click on the lock symbol
🔒 or ⓘ to the left of the website address in the address bar and then scroll down and click on the down arrow
next to Sound and select "Allow". You will need to do this on every website that you want to use
the speak() command on.
La frase anterior incluye \s* entre Wolfram y Alpha porque a veces la Web Speech API de Google detecta la frase como "Wolfram Alpha" y otras veces como "WolframAlpha". Este comando aceptará ambos. La Acción es en realidad un guión. Cada comando de script está separado por ;
(punto y coma). La primera acción en el script va al sitio web de wolframalpha con la cadena de entrada que se dijo. Por ejemplo, diga "Wolfram Alpha ¿Cuándo sale la próxima luna?". La siguiente acción en el script le dice a Speech Recognition Anywhere que hable en voz alta con un elemento de texto a voz en la página web. El elemento es un img etiqueta con class="_3c8e" . Wolfram Alpha pone el resultado en una imagen en lugar de texto sin formato. Pero esa imagen tiene un alt atributo con una respuesta de texto sin formato a la pregunta. Asi que img._3c8e[1] lee en voz alta el segundo o [1] img etiqueta con class="_3c8e" .
Aquí hay otro ejemplo de un comando personalizado de texto a voz que crea un Tomador de decisiones:
Frase: Debería (.*?)
Acción: say(Sí|No|Definitivamente sí|Absolutamente no|Probablemente no)
Descripción: Tomador de decisiones
Él say El comando leerá en voz alta cualquier texto que coloque allí. el | o tubería (también llamada barra vertical) separa cada texto para leer como un OR . El comando decir elegirá aleatoriamente una de las respuestas para leer en voz alta. Ahora haga cualquier pregunta que comience con "¿Debería...?"
secuencias de comandos
En el campo Acción de los comandos personalizados, puede crear un script de acción. Cada comando se separa con un ; (punto y coma). Aquí hay un ejemplo:
Acción: http://example.com/;scroll_it(down);click_element(search);speak(answer)
El script de acción anterior irá primero a example.com .
Luego se desplazará hacia abajo en la página, luego haga clic en un elemento con una id
de search y luego diga en voz alta el texto en un elemento con una id de
answer .
Scripting Commands
| ; | Separe cada comando en el campo Acción con ; |
| ;; | Pausa por 1 segundo. (Cada comando está separado por medio segundo, por lo tanto, para hacer una pausa de 1 segundo, use dos puntos y comas. |
| %3B | para imprimir un ; en la pantalla, use la versión codificada de URL (codificada en porcentaje) que es %3B |
| %28 %29 | Para imprimir paréntesis () usar %28 y %29 respectivamente. |
| \btexto\b | Si la frase comienza y termina con \b ,
el texto se reemplazará con el texto en el campo de acción. Por ejemplo:
para reemplazar paréntesis abierto con ( use:
Frase: \bparéntesis abierto\b
Acción: (
Descripción: Siempre reemplace: "paréntesis abierto" con "("
|
| add_labels(opción) |
Agregue etiquetas a los botones que son solo imágenes. la opción puede ser show o hide . |
| add_numbers(opción) |
Agregue números a enlaces, botones y entradas. la opción puede ser show o hide . |
| backspace(X) | Presione la tecla de retroceso. Donde x es la cantidad de veces que se presiona. El valor predeterminado es 1. |
| browse(opción) | Navegar por el historial del navegador. la opción puede ser back, forward, reload, refresh . Ejemplo para crear un comando para Regresar en el historial del navegador en español:
Frase: retroceder
Acción: browse(back)
Descripción Navegar hacia atrás en español |
| capitalize_first_letter(texto, todas_palabras) |
Convierta la primera letra del texto en mayúscula. Si todas_palabras es true luego, cada primera letra de cada palabra en el texto se convertirá a mayúscula. El valor predeterminado es false . Por ejemplo:
Frase: mayúscula (.*?)
Acción: capitalize_first_letter($1, true)
Descripción: Di "Hello world" en mayúsculas para imprimir "Hello World"
|
| clear_text() | Borra todo el texto en la entrada o área de texto actualmente seleccionada. |
| click_element(el) | el puede ser el id de un elemento para hacer clic o si el elemento no tiene un id entonces puede ser una etiqueta debajo de un elemento. Por ejemplo, si el es results.img[0] entonces el click_element comando hará clic en el primer (0) img debajo del elemento con id de "results" . |
| click_keyword(el) | el puede ser el id de un elemento para hacer clic o el name, text, title, aria-label o alt de un elemento para hacer clic. |
| clipboard(opción) | la opción puede ser copy, cut, paste |
| dictation(opción) | Active o desactive el dictado (voz a texto). la opción puede ser on, off, start, stop . (Solo disponible en la Versión Completa) |
| enter_key(x) | Pulse la tecla Intro. Donde x es la cantidad de veces que se presiona. El valor predeterminado es 1. |
| escape_key(x) | Pulse la tecla de escape. Donde x es la cantidad de veces que se presiona. El valor predeterminado es 1. |
| find_phrase(palabras clave) | Busque una palabra o frase en la página y resáltela o selecciónela. Por ejemplo, para crear un comando personalizado para buscar una palabra o frase en español como "Buscar restaurante":
Frase: (?:búsqueda |buscar )(?:de |para )?(.*?)
Acción: find_phrase($1)
Descripción: Buscar en Español |
| https:// | Inicie un comando en el campo Acción con
http:// , https:// , ftp:// , file:/// para ir a ese sitio web o archivo. Por ejemplo:
https://seabreezecomputers.com cambiará la ubicación actual a seabreezecomputers.com |
| insertHTML(html) | Previamente cualquiera html en el campo de acción se imprimiría como HTML . Ahora se imprimirá como texto desde la versión 1.4.4 (5/3/2021). Para imprimir html ahora use el insertHTML()
función en el campo de acción:
Frase: salto de línea
Acción: insertHTML(<br>)
Descripción: Decir salto de línea para insertar html: <br> |
| insertText(texto) | Para imprimir fácilmente texto en la pantalla incluyendo < > ( ) ;
Luego pon el texto en el insertText() dominio. Normalmente, las etiquetas html < > no se imprimirán y ( ); son caracteres especiales reservados en el campo Acción. Pero si pones los personajes en insertText() entonces se imprimirán bien en la pantalla. Ejemplo:
Acción: insertText(<div onclick="alert('Hello');">) |
| keypress(n, ctrl, alt, shift) | Para páginas web que escuchan pulsaciones de teclas. Dónde n es el keyCode de la tecla a pulsar. Por ejemplo: keypress(49) presionará el 1 llave. Ver
Tabla de códigos clave . O n puede ser la letra para presionar comokeypress(z). Ejemplo para enviar
ALT+Z : keypress(z, false, true) ; Ejemplo para enviar CTRL+Z :
keypress(z, 1); Si n es una cadena, entonces la cadena se convertirá en pulsaciones de teclas en el sitio web. Por ejemplo: keypress(zebra) ; enviará eventos de pulsación de teclas para z,e,b,r,a . |
| moveCursor(dirección, x, opción) | Mueva el cursor en la dirección de arriba, abajo, izquierda, derecha, arriba, abajo, inicio, final.
x es el número de veces que hay que moverse en esa dirección. El valor predeterminado es 1. La opción puede ser carácter, palabra, oración, párrafo, documento, papel, cuadro, texto o campo. El valor predeterminado es palabra. |
| open(sitio web, nombre_de_la_pestaña) |
Abra el sitio web en la pestaña nombre_de_la_pestaña .
Este comando se utiliza para abrir siempre en la misma pestaña. Si la pestaña nombre_de_la_pestaña ya
está abierta, permanecerá en segundo plano si no es la pestaña activa. Si no se proporciona nombre_de_la_pestaña
, este comando siempre abrirá una nueva pestaña. |
| play(palabras clave, nueva_pestaña) |
Reproduzca una canción o un video con palabras clave usando el botón Me siento afortunado de Google. El valor predeterminado para
nueva_pestaña es false . Aquí hay un ejemplo de un comando personalizado para reproducir música o un video en español:
Frase: (?:Toca|Juega) (.*?)(?: *?)?(?:en )?(?:una )?(nueva pesta[nñ]a)?
Acción: play($1, $2)
Descripción: play() en español. Di "Toca (música) (en una nueva pestaña)"
|
| print_text(texto) | Para imprimir fácilmente texto en la pantalla incluyendo < > ( ) ;
Luego pon el texto en el print_text() dominio. Normalmente, las etiquetas html < > no se imprimirán y( ) ;son caracteres especiales reservados en el campo Acción. Pero si pones los personajes en print_text() entonces se imprimirán bien en la pantalla. Ejemplo:
Acción: print_text(<div onclick="alert('Hello');">)
print_text() es sinónimo de insertText() .
|
| read(opción) | Leer en voz alta con texto a voz. la opción puede ser
all|everything|page|webpage|paragraph|screen|article|website|site|main|content|main content|alert|notification|status
buttons|inputs|links|hyperlinks|web links|images|figures|headings|titles|headlines
menu|navigation|header|banner|footer|contentinfo|sidebar|aside|complementary|toolbar
selection|selected|highlighted
|
| redo(X) | Rehacer el último texto que se deshizo con deshacer. x es el número de veces que se debe rehacer. El valor predeterminado es 1. |
| replace_word(texto) | Reemplazar una palabra en una oración con texto .
Por ejemplo: Para reemplazar "ok" with "okay" use:
Phrase: ok
Action: replace_word(okay)
Description: Always replace "ok" with "okay"
|
| say(texto) | Habla en voz alta con texto a voz. |
| script(código) | Puede incluir secuencias de comandos avanzadas en el código mediante el comando de secuencia de comandos. Usar return variable al final para que la variable se muestre en el área de texto. Por ejemplo, aquí hay un script de comando personalizado para mostrar la fecha de hoy en formato en-US:
Frase: (Escriba |Ingrese )?fecha de hoy
Acción: script(var today = new Date().toLocaleDateString('en-US'); return today;)
Descripción: Diga 'Ingrese la fecha de hoy' o 'Escriba la fecha de hoy' o 'Fecha de hoy'
|
| scroll_it(dirección) | Desplácese por la página. la dirección puede ser arriba, abajo, derecha, izquierda, arriba o abajo. También puede incluir un tipo de elemento con la dirección separada por una coma. El tipo de elemento puede ser
body, page, menu, navigation, sidebar or box. Por ejemplo: scroll_it(menu, down) desplazará un menú en la página hacia abajo. scroll_it(box) por defecto, desplazará un cuadro de texto en la página hacia abajo.
|
| scrollToPosition(el) | Desplácese hasta el elemento HTML si no está a la vista. el debería ser el id del elemento |
| select(opción) | la opción puede ser all o none . Seleccione todo el texto o nada de texto en la entrada o área de texto seleccionada actualmente o en la página. Algunas áreas de texto en algunos sitios web también permiten que la opción sea carácter, letra, palabra, oración, párrafo. Estas áreas de texto también pueden tener múltiples opciones separadas por una coma que incluye una dirección o la cantidad. Por ejemplo select(last, 3, words) seleccionará las 3 palabras anteriores detrás del cursor. Otro ejemplo,
select(next, 2, sentences) seleccionará las siguientes 2 oraciones delante del cursor.
select(sentence) seleccionará la frase anterior.
|
| set_language(idioma) | Establezca el idioma de reconocimiento de voz en idioma temporalmente. Se puede ver una lista desplegable de idiomas en el menú "Configuración" de Speech Recognition Anywhere. |
| spacebar(X) | Presiona la barra espaciadora. Donde x es la cantidad de veces que se presiona. El valor predeterminado es 1. |
| speak_element(el) | Leer o hablar en voz alta el contenido de un elemento. Leerá el innerText,
alt, aria-label or title atributo del elemento. el puede ser un selector como usando
querySelectorAll en JavaScript con una [n] opcional para especificar qué elemento de la matriz leer. Por ejemplo: para leer el resultado de WolframAlpha use
speak_element(img._3c8e[1]); El elemento es una etiqueta img con class="_3c8e" . Wolfram Alpha pone el resultado en una imagen en lugar de texto sin formato. Pero esa imagen tiene un alt atributo con una respuesta de texto sin formato a la pregunta. Asi que img._3c8e[1] lee en voz alta la segunda o [1] etiqueta img con class="_3c8e" .
| | submit_form() | Envíe el formulario actual en el sitio web. |
| switch_fields(opción) | Cambiar campos en un formulario o cambiar enlaces. La opción puede ser siguiente, anterior, palabra clave como el name o id de un elemento de formulario o el número en orden del elemento de formulario/enlace en la página. |
| switch_tabs(opción) | Cambia las pestañas del navegador. la opción puede ser siguiente, anterior, cerrar, último, primero, número de pestaña, título o URL de la pestaña. Aquí hay un ejemplo de un comando personalizado para español para cambiar de pestaña:
Frase: Cambiar (?:a )?(?:la )?(.*?)? ?pesta[nñ]as? ?(.*?)?
Acción: switch_tabs($1$2)
Descripción: Cambiar de pestaña en español. Di "Cambiar a la siguiente pestaña" o "Cambiar a la pestaña anterior".
|
| texto | Escriba texto en la página en la entrada o área de texto seleccionada actualmente o elegirá la primera entrada disponible en la página |
| .toUpperCase() | La manipulación de cadenas Javascript ahora se puede usar como toUpperCase() . Aquí hay un ejemplo de un comando personalizado para hacer que el discurso se hable en mayúsculas o en mayúsculas:
Frase: (?:mayúsculas|todas las mayúsculas) (.*?)
Acción: $1.toUpperCase()
Descripción: Diga "mayúsculas hola mundo" para imprimir "HOLA MUNDO"
|
| undo(X) | Deshacer el último comando de texto. x es el número de veces para deshacer. El valor predeterminado es 1. Aquí hay un ejemplo de cómo traducir un comando de deshacer al español:
Frase: Deshacer(?: *?)(\S*?)?(?: *?)(veces)?$
Acción: undo($1)
Descripción: Deshacer() en español. Di "Deshacer" o "Deshacer (Número) veces"
|
| url(sitio web, nueva_pestaña, enfocado) | Cambiar ubicación a sitio web .
El valor predeterminado para nueva_pestaña es false.
El valor predeterminado para enfocado es true .
Si enfocado se establece en false entonces la pestaña permanecerá en segundo plano.
Sólo hay que poner url() sin parámetros para abrir una nueva pestaña.
Aquí hay un ejemplo de un comando personalizado para visitar un sitio web en español:
Frase: ¿Visita[a]r? (.*?\.\s?\S{2,6})(?: *?)?(?:en )?(?:una )?(nueva pesta[nñ]a)?
Acción: url($1, $2)
Descripción: url() en Español. Di "Visita google punto com (en una nueva pestaña)"
nueva_pestaña también puede ser el nombre de una pestaña para que se reutilice una pestaña si el nombre es el mismo.
nueva_pestaña también puede ser una URL. Si nueva_pestaña es una URL, buscará si hay una pestaña que comience con esa URL y la usará; de lo contrario, creará una nueva pestaña. Por ejemplo, aquí hay un comando personalizado que buscará una pestaña que comience con https://www.youtube.com/ cuando un usuario diga "nombre de la canción de YouTube" y usará esa pestaña si existe:
Frase: (YouTube) (.*?)
Acción: url(https://www.google.com/search?btnI&q=youtube $2, https://www.youtube.com, true)
Descripción: "Reproducir (título de la canción o video)" usando Youtube
|
Privacy Policy
Last updated on January 2, 2023
Created on December 11, 2016 |