Konwersja mowy na tekst dla języka polskiego
Thread poster: Andrzej Mierzejewski
Andrzej Mierzejewski
Andrzej Mierzejewski  Identity Verified
Poland
Local time: 10:50
Polish to English
+ ...
Dec 14, 2011

Wyobraźmy sobie: policjant przesłuchuje świadka, nie notuje, tylko słucha. Zeznania spisuje komputer, który sam przetwarza mowę na tekst. Marzenie? Już nie.

Fragment zeznań mężczyzny, który po pijaku jechał rowerem: "Spożyłem alkohol w postaci tory i butelki wina owocowego".

- Zamiast "tory i", powinno być "półtorej". Takie błędy się zdarzają i musimy poprawić je ręcznie. Ale więcej czasu i tak oszczędzamy, niż tracimy - mówią policjanci, kt�
... See more
Wyobraźmy sobie: policjant przesłuchuje świadka, nie notuje, tylko słucha. Zeznania spisuje komputer, który sam przetwarza mowę na tekst. Marzenie? Już nie.

Fragment zeznań mężczyzny, który po pijaku jechał rowerem: "Spożyłem alkohol w postaci tory i butelki wina owocowego".

- Zamiast "tory i", powinno być "półtorej". Takie błędy się zdarzają i musimy poprawić je ręcznie. Ale więcej czasu i tak oszczędzamy, niż tracimy - mówią policjanci, którzy od miesiąca testują program komputerowy zamieniający mowę na tekst.

- Sprawdziliśmy: odkąd zeznania spisuje za policjantów komputer, czas przesłuchania skrócił się o jedną trzecią - potwierdza młodszy inspektor Sławomir Gembara z wielkopolskiej policji. Gembara koordynuje testy superprogramu: - Przegrywają z nim nawet policjanci potrafiący pisać bez spoglądania na klawiaturę.

Program, który może zrewolucjonizować pracę na polskich komisariatach, stworzył zespół naukowców z Poznańskiego Centrum Superkomputerowo-Sieciowego pod kierownictwem prof. Grażyny Demenko. Prace trwały sześć lat i kosztowały prawie 5 mln zł (płaciły Ministerstwo Nauki i Unia Europejska).

Jak to działa? W pamięci programu jest ponad 330 tys. słów, w tym wiele z policyjnego i prawniczego żargonu. Potrzebny jest tylko komputer z mikrofonem. Program jest na tyle inteligentny, że sam rozpoznaje nie tylko pojedyncze słowa - zamieniane na tekst - ale również ich kontekst. Dzięki temu automatycznie modyfikuje treść zdania, by miało sens. I tak: "protokół przesłuchania w Gdyni dzisiejszym", po chwili sam zmienia się na "protokół przesłuchania w dniu dzisiejszym". A zamiast "Na Szczecina, lat 28", pojawia się poprawna wersja: "Mężczyzna, lat 28".

- Program jest niemal doskonały. Nawet komercyjne firmy takiego cuda nie mają - cieszy się Gembara.

Od miesiąca komputer wyręcza w notowaniu 15 policjantów w pięciu województwach. W Poznaniu program testuje st. sierż. Katarzyna Nowicka z komisariatu na Nowym Mieście: - Sporządziłam tak już kilkanaście dokumentów. To protokoły przesłuchań, notatki służbowe, zawiadomienia o przestępstwie. Zostały włączone do akt sprawy.

W przyszłości komputer ma dokumentować nie tylko przesłuchania, ale również oględziny, wizje lokalne, badania laboratoryjne czy sekcje zwłok. Gembara: - Prace nad udoskonaleniem programu trwają.

Na razie nie wiadomo, kiedy dostęp do programu zyskają kolejni policjanci. Tylko w Wielkopolsce w wydziałach dochodzeniowo-śledczych pracuje tysiąc funkcjonariuszy (tam powstaje większość dokumentów).

Program powstał w ramach Polskiej Platformy Bezpieczeństwa Wewnętrznego. To wspólny projekt ośmiu ośrodków akademickich, policji oraz tajnych służb. Idea jest prosta: wykorzystanie nowych technologii informatycznych w walce z przestępczością

http://poznan.gazeta.pl/poznan/1,36037,10813177,Przesluchanie_przyszlosci__komputer_sam_notuje.html


Baza zrealizowana w PCSS w ramach projektu OR00006707: Zintegrowany system automatycznej konwersji mowy polskiej na tekst oparty na modelu językowym stworzonym w środowisku analizy i obiegu dokumentów prawniczych w zakresie bezpieczeństwa wewnętrznego, Projekt badawczo-rozwojowy finansowany przez Ministerstwo Nauki Szkolnictwa Wyższego RP na podstawie decyzji nr 0067/R/T00/2009/07, termin zakończenia 08.07.2011.
http://www.man.poznan.pl/online/pl/projekty/105/Laboratorium_Jezyka_i_Mowy.html

Brzmi obiecująco.
Ale dlaczego tylko policja? Mnie też by się przydało.
Ciekawe, kiedy będzie w sprzedaży detalicznej i z jaką ceną.

AM
Collapse


 
Adam Łobatiuk
Adam Łobatiuk  Identity Verified
Poland
Local time: 10:50
Member (2009)
English to Polish
+ ...
Dobrze będzie :) Dec 14, 2011

Z kolei w roku 2012 dostępne mają być wersje aplikacji Dragon dla komputerów desktop. Rozwiązanie to wprowadzone zostanie wraz ze słownikami branżowymi dla trzech grup zawodowych - prawników, lekarzy i dziennikarzy. Koszt wersji na komputery desktop to ok. 100 USD.
... See more
Z kolei w roku 2012 dostępne mają być wersje aplikacji Dragon dla komputerów desktop. Rozwiązanie to wprowadzone zostanie wraz ze słownikami branżowymi dla trzech grup zawodowych - prawników, lekarzy i dziennikarzy. Koszt wersji na komputery desktop to ok. 100 USD.


http://www.computerworld.pl/news/376585/Nuance.Communications.rozszerza.dzialalnosc.w.Polsce.html

To, co Dragon wyczynia na iPadzie, jest niesamowite. Bez żadnego treningu spokojnie i na bieżąco pisze z minimum pomyłek. Zresztą Android też ładnie rozpoznaje polski. Myślę, że warto będzie poczekać.
Collapse


 
Andrzej Lejman
Andrzej Lejman  Identity Verified
Poland
Local time: 10:50
Member (2004)
German to Polish
+ ...
Nie pomyśleli o tłumaczach? Dec 14, 2011

Przecież nas jest chyba więcej niż np. dziennikarzy, w każdym razie tych piszących.

Porażka...

A.


 
geopiet
geopiet  Identity Verified
Polish to English
+ ...
Google Translator Dec 15, 2011

Adam Łobatiuk wrote:

Zresztą Android też ładnie rozpoznaje polski. Myślę, że warto będzie poczekać.


Google Translator jest też do iPhone, fajna zabawka - http://itunes.apple.com/us/app/google-translate/id414706506?mt=8


 
Tomasz Poplawski
Tomasz Poplawski  Identity Verified
Local time: 04:50
Member (2007)
English to Polish
+ ...
Andrzeju Dec 15, 2011

Przecież tłumacze, w zależności od specjalizacji, to lekarze, dziennikarze albo adwokaci. Najczęściej zaś - połączenie wszystkich trzech, z domieszką finansisty i mechanika samochodowego

 
Piotr Sawiec
Piotr Sawiec  Identity Verified
Local time: 10:50
English to Polish
+ ...
Magicscribe Dec 15, 2011

są 2 polskie aplikacje Magicscribe i Skrybot. http://www.proz.com/forum/polish/187484-próbowaliście_magicscribe-page3.html
tego pierwszego używam coraz więcej, jest nieźle. Używam też angielskiego dragona i jest rewelacyjnie. Jeżeli polski dragon będzie tak dobry, to w ciemno biorę.


 
Piotr Bienkowski
Piotr Bienkowski  Identity Verified
Poland
Local time: 10:50
English to Polish
+ ...
Google Translator - Tak :-) Dec 16, 2011

geopiet wrote:

Adam Łobatiuk wrote:

Zresztą Android też ładnie rozpoznaje polski. Myślę, że warto będzie poczekać.


Google Translator jest też do iPhone, fajna zabawka - http://itunes.apple.com/us/app/google-translate/id414706506?mt=8


Testowałem mówienie do Googla po angielsku, ale nie powala jakością na kolana - chyba nie rozumie mojego British English akcentu zbyt dobrze, ale jak się do GT ustawionego na angielski zacznie mówić po rosyjsku, to dopiero boki można zrywać...

PB


 
Piotr Sawiec
Piotr Sawiec  Identity Verified
Local time: 10:50
English to Polish
+ ...
Jakość wymowy ma znaczenie Jan 27, 2012

Piotrze,
a rzeczywiście masz dobrą wymowę? Niestety programy wymagają specyficznego sposobu mówienia, nie dość że w miarę poprawnego językowo, to w równym rytmie i wyraźnie. Nauka np. pracy z Dragonem zajęła mi pewnie z kilkanaście tygodni, musiałem się do niego zdrowo dostosować i jest nieźle (a on dostosowuje się do mnie), ale jak zawalę wymowę to jest kicha.


 
Marcin Affelski
Marcin Affelski
Poland
Local time: 10:50
Oprogramowanie do przetwarzania mowy koniec rokku 2019 Dec 30, 2019

Brałem udział w projekcie stworzenia aplikacji webowej na potrzeby na razie naukowców. Projekt był dla Uniwersytetu Warszawskiego robiony (koniec 2019 roku - być może jest coś opisane na kamee.pl ), ale system miał być za darmo dostępny dla naukowców z całego świata.
Celem projektu było wykonanie aplikacji i bazy danych do przetwarzania mowy gwary mieszkańców Zaolzia. Jest to mały teren na pograniczu Polski i Słowacji. Wprowadzali materiały w tysiącach, a aplikacja mia
... See more
Brałem udział w projekcie stworzenia aplikacji webowej na potrzeby na razie naukowców. Projekt był dla Uniwersytetu Warszawskiego robiony (koniec 2019 roku - być może jest coś opisane na kamee.pl ), ale system miał być za darmo dostępny dla naukowców z całego świata.
Celem projektu było wykonanie aplikacji i bazy danych do przetwarzania mowy gwary mieszkańców Zaolzia. Jest to mały teren na pograniczu Polski i Słowacji. Wprowadzali materiały w tysiącach, a aplikacja miała wyłapywać konteksty i rozumieć więcej niż słowo po słowie. Przykład z

Fragment zeznań mężczyzny, który po pijaku jechał rowerem: "Spożyłem alkohol w postaci tory i butelki wina owocowego".

nie jest na dziś problemem technicznym. Co innego to odpowiednia baza materiałów źródłowych do przetworzenia. Oczywiście przy zeznaniach raczej za naszego życia takie aplikacje nie będę wykorzystywane. Natomiast to mniej wrażliwych zagadnień jak najbardziej.
Collapse


 


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Monika Jakacka Márquez[Call to this topic]

You can also contact site staff by submitting a support request »

Konwersja mowy na tekst dla języka polskiego






TM-Town
Manage your TMs and Terms ... and boost your translation business

Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.

More info »
Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »