Umschalten von Mac auf Windows 10-Integration des Text-to-Speech-Dienstes

Question

Umschalten von Mac auf Windows 10-Integration des Text-to-Speech-Dienstes

Apples enge Integration von POSIX-konformen Dateipfaden und einer Befehlszeilenschnittstelle sowie ihre historisch starken Hardware-und Fertigungsstandards haben mich seit Jahren auf der Mac-Plattform. Der jüngste enttäuschende und glanzlose Fokus von Apple auf macOS und seine Hardware sowie ein Lenovo X1 Yoga der 2.Generation haben meine Aufmerksamkeit erregt.

Switching OS hat jedoch zwei scheinbar unüberwindbare Bereiche, die mich betreffen. Dieser Beitrag konzentriert sich auf Text-to-Speech-OS-integration.

Ich habe das durchgemacht. Erzähler Dokumentation, die ich nicht hilfreich gefunden habe. Zugegeben, mein Anwendungsfall hängt nicht damit zusammen, sehbehindert zu sein. Einer meiner Anwendungsfälle ist, dass der Erzähler nur ausgewählten Text liest, wie ich unten skizziere. Zum Beispiel in diesem 2012 SuperUser Post hat der Fragesteller das gleiche Problem,ohne zufriedenstellende Antwort.

Ich möchte auch betonen, dass " copy and paste into a drittanbieter-TTS-Anwendung " ist unbefriedigend. Auf meinem Mac kann ich eine Eingabe bereitstellen und eine MP3-TTS-Datei ohne Benutzereingriff dazwischen für mein #1-Szenario unten abrufen. Ich führe dies auch nur mit Open-Source-Tools durch, mit Ausnahme des Befehls" say".

Ich habe die Text-to-Speech-Integration von Mac schon lange genutzt. Ich benutze es auf drei spezifische Arten, obwohl eine Kombination der folgenden 90% meiner Anwendungsfälle definiert.

Konvertieren von neu formatiertem Text aus E-Mails, die ich möchte habe mir zu einem späteren Zeitpunkt vorgelesen
- Mein aktueller Mac-Workflow: Ich kopiere die Quelle aus meiner E-Mail, verwende ein vim-Skript, das HTML entfernt und den Text belässt, den ich gelesen haben möchte. Zum Beispiel fügt dieses Skript einen Befehl" silence " [slnc 2000] ein, mit dem ich Absatzmarkierungen identifizieren kann, wenn ich den gelesenen Text abhöre.
- Nachdem das Text-Markup abgeschlossen ist, übergebe ich den formatierten Text über den Befehl "say", der einen Hauch von Text-to-Speech erzeugt.
- Mit lame, Ich konvertiere dies dann in eine MP3 und schiebe die MP3 ' s mit dropcaster an einen statischen öffentlichen Ort, an dem mein Podcast-Client sie abrufen kann.
- Dank Bash-Skripten dauert das Obige 5 Sekunden meiner Zeit. Das letzte Mal, als ich von Mac zu Windows wechselte, habe ich das sehr vermisst. Ich habe in der Vergangenheit Readalouds TTs-Software verwendet, war aber immer kludgy als oben.
Live-Korrekturlesen von E-Mails oder Dokumenten, die ich erstelle. Ich finde Fehler mehr einfach, wenn ich meinen Mac habe, lese mir meinen geschriebenen Text zurück.
- Ja, ich kann in Notepad kopieren und einfügen, aber das ist ungeschickt. Beim Betrachten der Benutzeroberfläche von Narrator fiel es mir sehr schwer herauszufinden, wie Narrator ausgewählten Text in verschiedenen Anwendungen lesen kann, z. B. Outlook, Firefox, Word usw.
Verwenden von TTS zum Lesen ausgewählter Browsertexte in langen Artikeln, die ich hören möchte, während ich nicht aufmerksamkeitsintensive Aufgaben ausführe.
- Dies ist ähnlich wie #2, ich könnte jedoch entscheiden, dass es sich lohnt, eine Datei für den Podcast zu erstellen, wenn der gelesene Text meine Aufmerksamkeit auf sich zieht, und ich werde zu einem #1-Prozess wechseln.
- Firefox verfügt über einen" Reader " - Modus, der weitgehend hilft und unter Windows gut funktioniert.

Meine Fragen sind:

Gibt es eine gleichwertige Möglichkeit, eine formatierte Textdatei unter Win10 zur Verarbeitung an eine MS-Binärdatei zu übergeben, ähnlich dem Befehl "say" auf dem Mac? Ich sehe docker bilder, die TTS-spezifisch sind, dachte das scheint mehr notdürftigem.
Was ist der native Weg, um Windows 10 Narrator ausgewählten Text so einfach lesen zu lassen, wie Text in einer Anwendung auszuwählen, einen Tastaturbefehl aufzurufen und Win10 TTS-Dienste auszuführen?

Ich bin offen Ihre kann unterschiedlich sein, aber ähnlich wie die oben genannten. "Copy and paste into notepad" ist jedoch auch ein Kludge. Ich hoffe, MS hat ihre Hausaufgaben zur Barrierefreiheit und Bereitstellung so gut gemacht wie Apple.

Einige hinweise an sich selbst, während ich diese Frage weiter erforsche

Es gibt mehrere Python-Pakete, die TTS in einem Python-Skript aktivieren. Anfangs sah dies vielversprechend aus, aber es gibt einige schwerwiegende Probleme, die sich auf die hier beschriebenen Python-Methoden konzentrieren: https://pythonprogramminglanguage.com/text-to-speech/
- Ich hatte Probleme pyttsx zu installieren. Ich habe py2.7.13 und py3.6.1 vorinstalliert und konnte mit pip3 oder pip keine der beiden Versionen erfolgreich installieren. Der original pyttsx ist py2, mit einer Gabel für py3. Dies ist zu schade, da das Design das Python-Modul zur Verwendung der nativen TTS-Engine aufruft. Wenn pyttsx auf python3 funktioniert und das Projekt aktiver wäre, wäre ich besser geeignet, den Fehler des Moduls zu beheben. Sie können meine Kommentare zu einer vorgeschlagenen Antwort lesen hier.

Es gibt eine Docker-Option, https://github.com/parente/espeakbox funktioniert gut, aber die Stimme ist, wo TTS war 6 + Jahren. Während ich den Wunsch des Autors respektiere, eine performante TTS-Engine zu erstellen, liebe ich Macs native TTS und möchte damit auf Augenhöhe sein.

Wenn Sie mit anderen nicht-nativen TTS-Optionen wie Merlin oder oder spielen, ist die TTS-Qualität nicht vergleichbar mit nativem TTS für Mac oder Windows.

als gemäß dem Vorschlag von LưU VĩNh Phúc scheint es einfach zu sein, native Windows-TTS gemäß dieser Seite zu automatisieren: https://www.pdq.com/blog/powershell-text-to-speech-examples/. Ich komme einer Lösung näher.

2

windows-10 mac text-to-speech accessibility

Author: Screenack, 2017-06-04

Source

1 answers

score 3 · Answer 1

MS Office hat Text-to-Speech unterstützt, lange bevor es in Windows integriert wurde (seit Vista). Als Ergebnis können Sie immer MS Word öffnen und haben es das Dokument für Sie lesen. Fügen Sie einfach die Schaltfläche Speak zur Menüband - /Schnellzugriffsleiste hinzu, wählen Sie den Text aus und klicken Sie darauf, oder weisen Sie der Sprechfunktion eine Verknüpfung zu

Narrator unterstützt auch diese Funktion. Sie müssen nur die Verknüpfungsliste überprüfen

Ctrl + Shift + Spacebar         Read the entire selected window
Ctrl + Alt + Spacebar           Read the items that are selected in the current window
Insert + Ctrl + G               Read a description of the items that appear next to the currently selected element
Ctrl                            Stop Narrator from reading text
Insert + F3                     Read the current character
Insert + F4                     Read the current word
Insert + F5                     Read the current line
Insert + F6                     Read the current paragraph
Insert + F7                     Read the current page
Insert + F8                     Read the current document
                                
Caps Lock + H                   Read document
Caps Lock + U                   Read next page
Caps Lock + Ctrl + U            Read current page
Caps Lock + Shift + U           Read previous page
Caps Lock + I                   Read next paragraph
Caps Lock + Ctrl + I            Read current paragraph
Caps Lock + Shift + I           Read previous paragraph
Caps Lock + O                   Read next line
Caps Lock + Ctrl + O            Read current line
Caps Lock + Shift + O           Read previous line
Caps Lock + P                   Read next word
Caps Lock + Ctrl + P            Read current word
Caps Lock + Shift + P           Read previous word

Swipe up with three fingers     Read current window
Swipe down with three fingers Start reading explorable text

Hören Sie Text vorgelesen mit Erzähler

Wie Windows 8 Erzähler sagen nur zu lesen, was ich speziell sagen, es zu lesen und bleiben absolut still sonst?

Windows 10 unterstützt den Scan-Modus, damit Sie schneller gehen können. Es kann durch Caps lock umgeschaltet werden+Leertaste

Jedoch Erzähler funktioniert nicht gut wird MS Office, so dass Sie den Text auf eine externe Anwendung kopieren müssen. Dies kann mit einem AutoHotkey erreicht werden. Es muss das ausgewählte kopieren text und Feed zum folgenden VBS-Skript

Dim text, sapi
Set text = WScript.Arguments(0)
Set sapi = CreateObject("sapi.spvoice")
sapi.Speak text

Dumme Geek Tricks: Wie Sie Ihren Computer mit Ihnen sprechen

Ich glaube nicht, dass es beim Lesen einer Webseite etwas anderes gibt als bei einem einfachen Text. Aber überprüfen Sie diese Wie benutzt man Narrator zum Lesen des Inhalts von Webseiten?

Einige andere TTS-Anwendungen unter Windows finden Sie hier

Die Textleseausgabe kann mit Tonnen von Software da draußen aufgezeichnet werden. Falls Sie es nicht tun willst du es hören und musst nur die Ausgabedatei speichern, dann benutze eine Stream-Mixing-Software wie GraphStudioNext (im K-lite Codec Pack enthalten) und leite den Ausgabestream in eine Datei um; konvertiere vorher in MP3, wenn nötig

GraphStudioNext

Alle oben genannten Dinge können mit einem Skript automatisiert werden. Vergessen Sie die Batch-Datei, PowerShell ist sehr leistungsfähig und kann alles tun, was mit Bash getan werden kann. Es kann Format aus Text entfernen und bearbeiten, so dass keine Notwendigkeit für die vimscript. Es gibt auch vim für Windows. Oder bei Bedarf können Sie bash immer unter Windows oder Cygwin installieren. GUI-Automatisierung kann auch mit AutoHotKey.