Bon any nou,
Us volia fer una pregunta per si algú de vosaltres ha fet servir
programari de conversió d'àudio a text.
Tinc un amic que ha de transcriure multituds d'entrevistes en castellà,
i no té temps.
Li vaig ensenyar a instal.lar-se Linux Mint (-sí, he pecat, ja sé que no és Debian-), que és el sistema que ara té.
Ell ha trobat com a eina ParlaType , però sembla que no és una eina de conversió, sinó que és un reproductor molt adaptat a fer transcripcions:
https://www.parlatype.org/
Jo li he trobat eines online, però no he provat cap:
https://www.google.com/search?q=convert+audio+text
Vosaltres heu fet servir alguna eina a Debian per conversió d'àudio a
text que podeu recomanar?
Gràcies
Àlex
Varies vegades he cercat programari per aquest tema, però no hi ha gaire cosa adaptada a l'usuari inexpert.
Tot el què he trobat en programari lliure són components per a programació (llibreries, API, etc.) que semblen bons però no tant fàcils d'utilitzar com el ffmpeg o una aplicació gràfica:
https://en.wikipedia.org/wiki/Julius_(software) https://github.com/julius-speech/julius
Al repositori de Debian hi trobo:
python3-sphinxbase
Salut.
El 9/1/23 a les 14:47, Àlex ha escrit:
Bon any nou,
Us volia fer una pregunta per si algú de vosaltres ha fet servir programari de conversió d'àudio a text.
Tinc un amic que ha de transcriure multituds d'entrevistes en castellà, i no té temps.
Li vaig ensenyar a instal.lar-se Linux Mint (-sí, he pecat, ja sé que no és Debian-), que és el sistema que ara té.
Ell ha trobat com a eina ParlaType , però sembla que no és una eina de conversió, sinó que és un reproductor molt adaptat a fer transcripcions:
https://www.parlatype.org/
Jo li he trobat eines online, però no he provat cap:
https://www.google.com/search?q=convert+audio+text
Vosaltres heu fet servir alguna eina a Debian per conversió d'àudio a text que podeu recomanar?
Gràcies
Àlex
Jo he fet servir VOSK amb bons resultats en català i castellà https://alphacephei.com/vosk/
Salut!
^dj
On 1/9/23 11:03 PM, j <jamoros@riseup.net> wrote:
Hola,
gràcies per la resposta Narcís.
Àlex si no et fa res compartir amb mi el que trobis t'ho agrairia (per
privat o no). I tot el que estigui relacionat amb inclusiva. Al menys
per una any he canviat de treball i tot el que pugui tenir relació amb
inclusivitat i programari lliure m'interessa.
Vagi bé
El 2023-01-09 15:05, Narcis Garcia va escriure:
Varies vegades he cercat programari per aquest tema, però no hi ha >gaire cosa adaptada a l'usuari inexpert.
Tot el què he trobat en programari lliure són components per a >programació (llibreries, API, etc.) que semblen bons però no tant >
fàcils d'utilitzar com el ffmpeg o una aplicació gràfica:
<https://en.wikipedia.org/wiki/Julius_(software)>
https://en.wikipedia.org/wiki/Julius_(software) >
https://github.com/julius-speech/julius ><https://github.com/julius-speech/julius>
programari de conversió d'àudio a text.
Al repositori de Debian hi trobo:
python3-sphinxbase
Salut.
El 9/1/23 a les 14:47, Àlex ha escrit:
Bon any nou,
Us volia fer una pregunta per si algú de vosaltres ha fet servir >>
castellà, i no té temps.
Tinc un amic que ha de transcriure multituds d'entrevistes en >>
que >> no és Debian-), que és el sistema que ara té.
Li vaig ensenyar a instal.lar-se Linux Mint (-sí, he pecat, ja sé
transcripcions:
Ell ha trobat com a eina ParlaType , però sembla que no és una eina
de conversió, sinó que és un reproductor molt adaptat a fer >>
<https://www.google.com/search?q=convert+audio+text>
https://www.parlatype.org/ <https://www.parlatype.org/>
Jo li he trobat eines online, però no he provat cap:
https://www.google.com/search?q=convert+audio+text >>
a >> text que podeu recomanar?
Vosaltres heu fet servir alguna eina a Debian per conversió d'àudio
Gràcies
Àlex
--
------------------------------------------------------------------------
El 2003 el català era la llengua habitual del 46 % dels catalans. Al
2018 només del 36 %. Si els castellanoparlants no actuem, desapareixerà. >>
El 3 de novembre representa el moment de l'any en el que les dones
deixen de cobrar en comparació amb els homes. Hem d’ajudar a les dones
a eliminar aquesta data.
L’administració pública cada any es gasta milions d’euros en
llicències de programari privatiu. Utilitzant programari lliure
estalviem costos i incentivem l’economia local.
/La neutralitat davant les desigualtats acaba accentuant-les./
Hola,
gràcies per la resposta Narcís.
Àlex si no et fa res compartir amb mi el que trobis t'ho agrairia (per privat o no). I tot el que estigui relacionat amb inclusiva. Al menys
per una any he canviat de treball i tot el que pugui tenir relació amb inclusivitat i programari lliure m'interessa.
Vagi bé
El 2023-01-09 15:05, Narcis Garcia va escriure:
Varies vegades he cercat programari per aquest tema, però no hi ha
gaire cosa adaptada a l'usuari inexpert.
Tot el què he trobat en programari lliure són components per a programació (llibreries, API, etc.) que semblen bons però no tant fàcils d'utilitzar com el ffmpeg o una aplicació gràfica:
https://en.wikipedia.org/wiki/Julius_(software) <https://en.wikipedia.org/wiki/Julius_(software)> https://github.com/julius-speech/julius <https://github.com/julius-speech/julius>
Al repositori de Debian hi trobo:
python3-sphinxbase
Salut.
El 9/1/23 a les 14:47, Àlex ha escrit:
Bon any nou,
Us volia fer una pregunta per si algú de vosaltres ha fet servir
programari de conversió d'àudio a text.
Tinc un amic que ha de transcriure multituds d'entrevistes en
castellà, i no té temps.
Li vaig ensenyar a instal.lar-se Linux Mint (-sí, he pecat, ja sé que >> no és Debian-), que és el sistema que ara té.
Ell ha trobat com a eina ParlaType , però sembla que no és una eina
de conversió, sinó que és un reproductor molt adaptat a fer
transcripcions:
https://www.parlatype.org/ <https://www.parlatype.org/>
Jo li he trobat eines online, però no he provat cap:
https://www.google.com/search?q=convert+audio+text
<https://www.google.com/search?q=convert+audio+text>
Vosaltres heu fet servir alguna eina a Debian per conversió d'àudio a >> text que podeu recomanar?
Gràcies
Àlex
--
------------------------------------------------------------------------
El 2003 el català era la llengua habitual del 46 % dels catalans. Al
2018 només del 36 %. Si els castellanoparlants no actuem, desapareixerà.
El 3 de novembre representa el moment de l'any en el que les dones
deixen de cobrar en comparació amb els homes. Hem d’ajudar a les dones a eliminar aquesta data.
L’administració pública cada any es gasta milions d’euros en llicències
de programari privatiu. Utilitzant programari lliure estalviem costos i incentivem l’economia local.
/La neutralitat davant les desigualtats acaba accentuant-les./
Bon any nou,
Us volia fer una pregunta per si algú de vosaltres ha fet servir
programari de conversió d'àudio a text.
Tinc un amic que ha de transcriure multituds d'entrevistes en
castellà, i no té temps.
Li vaig ensenyar a instal.lar-se Linux Mint (-sí, he pecat, ja sé que
no és Debian-), que és el sistema que ara té.
Ell ha trobat com a eina ParlaType , però sembla que no és una eina de conversió, sinó que és un reproductor molt adaptat a fer transcripcions:
https://www.parlatype.org/
Jo li he trobat eines online, però no he provat cap:
https://www.google.com/search?q=convert+audio+text
Vosaltres heu fet servir alguna eina a Debian per conversió d'àudio a
text que podeu recomanar?
Gràcies
Àlex
També hi ha oTranscribe en format d'eina web: https://otranscribe.bsc.es/ que té
llicència MIT.
Però el resultats seran millors o pitjors en funció de la qualitat de l'àudio
(soroll o música de fons, veus simultànies, quequeig, etc.). Gairebé segur que
cal postedició.
Àlex si no et fa res compartir amb mi el que trobis t'ho
agrairia (per privat o no). I tot el que estigui relacionat
amb inclusiva. Al menys per una any he canviat de treball i
tot el que pugui tenir relació amb inclusivitat i programari
lliure m'interessa.
Àlex si no et fa res compartir amb mi el que trobis t'ho
agrairia (per privat o no). I tot el que estigui relacionat
amb inclusiva. Al menys per una any he canviat de treball i
tot el que pugui tenir relació amb inclusivitat i programari
lliure m'interessa.
El grup de recerca TALP de la UPC té diverses eines relacionades
que tenen llicència GPL:
https://www.talp.cat/page-tools-lists
Salut,
Alex
--
⢀⣴⠾⠻⢶⣦⠀
⣾⠁⢠⠒⠀⣿⡁ Alex Muntada <alexm@debian.org>
⢿⡄⠘⠷⠚⠋ Debian Developer 🍥 log.alexm.org
⠈⠳⣄⠀⠀⠀⠀
Bon any nou,
Us volia fer una pregunta per si algú de vosaltres ha fet servir
programari de conversió d'àudio a text.
Tinc un amic que ha de transcriure multituds d'entrevistes en
castellà, i no té temps.
Li vaig ensenyar a instal.lar-se Linux Mint (-sí, he pecat, ja sé que
no és Debian-), que és el sistema que ara té.
Ell ha trobat com a eina ParlaType , però sembla que no és una eina de conversió, sinó que és un reproductor molt adaptat a fer transcripcions:
https://www.parlatype.org/
Jo li he trobat eines online, però no he provat cap:
https://www.google.com/search?q=convert+audio+text
Vosaltres heu fet servir alguna eina a Debian per conversió d'àudio a
text que podeu recomanar?
Gràcies
Àlex
Moltes gràcies a tothom pels vostres consells
Missatge de Àlex <alex@probeta.net <mailto:alex@probeta.net>> del dia
dg., 15 de gen. 2023 a les 17:48:
Moltes gràcies a tothom pels vostres consells
Hola!
Disculpeu que reobri el tema.
No n'havia dit res abans perquè encara estava en desenvolupament i no
estava publicat., però ara ja és obert.
A Softcatalà tenim en proves un servei de transcripció [1], basat en Whisper. Està enfocat per a l'usuari final i proporcionem enllaços a
altres eines amb funcions similars.
Qualsevol suggeriment és benvingut :)
Joan Montané
[1] https://www.softcatala.org/transcripcio/ <https://www.softcatala.org/transcripcio/>
Gràcies Joan;
Un parell de preguntes:
1. Quina diferència hi ha entre un model «petit» i un de «mitjà»?
2. És programari lliure?
</div><div><br></div></div>
Hola,
molt bon treball Joan. Com sempre softcatalà treballant per a la comunitat.
A on estic ara l'han rebut molt bé i segurament el començaran a fer
servir aviat.
Això sí, sempre hi ha algú que li agrada posar reptes. Em demanen si existeix alguna aplicació que detecti llenguatge de signes català i els passi a text.
He al·lucinat perquè efectivament hi ha alguna cosa de reconeixement de llenguatge de signes, però en "argentí" i tb hi ha un indi:
https://github.com/hthuwal/sign-language-gesture-recognition
https://github.com/emnikhil/Sign-Language-To-Text-Conversion
Sabeu si hi ha alguna cosa semblant per la llengua de signes en català?
Merci
On 02/02/2023 16:56, Joan Montané wrote:
Responc entre paràgrafs,--
Missatge de Narcis Garcia <debianlists@actiu.net> del dia dj., 2 de
febr. 2023 a les 8:35:
Gràcies Joan;
Un parell de preguntes:
1. Quina diferència hi ha entre un model «petit» i un de «mitjà»? >>
El model petit és més lleuger, ocupa menys. En general, la mida afecta
la qualitat de forma proporcional i la rapidesa d'inferència de forma
inversa. Això és, amb caràcter general, un model petit obtindrà
resultats de menys qualitat, però de forma més ràpida, que no pas un
model mitjà.
2. És programari lliure?
Whisper? Això és d'OpenAI. El codi i els models són lliures, però les
dades emprades per a crear el model no ho són. Més informació sobre
Whisper aquí: https://openai.com/blog/whisper/ i
https://github.com/openai/whisper
La part de Softcatalà consisteix en:
- Un formulari web per a enviar la petició:
https://github.com/Softcatala/wp-softcatala/blob/master/templates/transcribe.twig
- Un servei que gestiona la cua de peticions, crida al motor de
transcripció i envia un correu a l'usuari quan la tasca s'ha
enllestit: https://github.com/Softcatala/transcribe-service
- Una pàgina de retorn que permet:
https://github.com/Softcatala/wp-softcatala/blob/master/templates/transcribe-results.twig
a) Baixar-se la transcripció.
b) Addicionalment, editar la transcripció des del navegador en un
oTranscribe:
https://github.com/Softcatala/wp-softcatala/blob/master/static/js/otranscribe.js
Per tant, sí, la part de Softcatalà és lliure. Amb tot, en ser un
servei que s'executa en la banda de servidor, per molt que sigui
lliure, sempre hi ha el punt que no saps del cert què passa a l'altra
banda. Per això, entre altres motius, enllacem Buzz, que és una molt
bona opció en local. La llàstima és que només hi ha versió per a
Windows i Mac :_(
He de dir que no he participat en la programació, Així que no puc
respondre gaires aspectes tècnics. Però qualsevol comentari és
benvingut. Sigui de l'experiència d'usuari o de la implementació. Gràcies.
Joan Montané
____________________________________________________
El 2003 el català era la llengua habitual del 46 % dels catalans. Al 2018 només del 36 %. Si els castellanoparlants no actuem, desapareixerà.
El 3 de novembre representa el moment de l'any en el que les dones deixen de cobrar en comparació amb els homes. Hem d’ajudar a les dones a eliminar aquesta data.
L’administració pública cada any es gasta milions d’euros en llicències de programari privatiu. Utilitzant programari lliure estalviem costos i incentivem l’economia local.
La neutralitat davant les desigualtats acaba accentuant-les.
Responc entre paràgrafs,
Missatge de Narcis Garcia <debianlists@actiu.net> del dia dj., 2 de
febr. 2023 a les 8:35:
Gràcies Joan;
Un parell de preguntes:
1. Quina diferència hi ha entre un model «petit» i un de «mitjà»?
El model petit és més lleuger, ocupa menys. En general, la mida afecta
la qualitat de forma proporcional i la rapidesa d'inferència de forma inversa. Això és, amb caràcter general, un model petit obtindrà
resultats de menys qualitat, però de forma més ràpida, que no pas un
model mitjà.
2. És programari lliure?
Whisper? Això és d'OpenAI. El codi i els models són lliures, però les dades emprades per a crear el model no ho són. Més informació sobre Whisper aquí: https://openai.com/blog/whisper/ i https://github.com/openai/whisper
La part de Softcatalà consisteix en:
- Un formulari web per a enviar la petició: https://github.com/Softcatala/wp-softcatala/blob/master/templates/transcribe.twig
- Un servei que gestiona la cua de peticions, crida al motor de
transcripció i envia un correu a l'usuari quan la tasca s'ha
enllestit: https://github.com/Softcatala/transcribe-service
- Una pàgina de retorn que permet: https://github.com/Softcatala/wp-softcatala/blob/master/templates/transcribe-results.twig
a) Baixar-se la transcripció.
b) Addicionalment, editar la transcripció des del navegador en un oTranscribe: https://github.com/Softcatala/wp-softcatala/blob/master/static/js/otranscribe.js
Per tant, sí, la part de Softcatalà és lliure. Amb tot, en ser un
servei que s'executa en la banda de servidor, per molt que sigui
lliure, sempre hi ha el punt que no saps del cert què passa a l'altra
banda. Per això, entre altres motius, enllacem Buzz, que és una molt
bona opció en local. La llàstima és que només hi ha versió per a
Windows i Mac :_(
He de dir que no he participat en la programació, Així que no puc
respondre gaires aspectes tècnics. Però qualsevol comentari és
benvingut. Sigui de l'experiència d'usuari o de la implementació. Gràcies.
Joan Montané
Hola,
molt bon treball Joan. Com sempre softcatalà treballant per a la comunitat.
A on estic ara l'han rebut molt bé i segurament el començaran a fer servir aviat.
Això sí, sempre hi ha algú que li agrada posar reptes. Em demanen si existeix alguna aplicació que detecti llenguatge de signes català i els passi a text.
He al·lucinat perquè efectivament hi ha alguna cosa de reconeixement de llenguatge de signes, però en "argentí" i tb hi ha un indi:
https://github.com/hthuwal/sign-language-gesture-recognition
https://github.com/emnikhil/Sign-Language-To-Text-Conversion
Sabeu si hi ha alguna cosa semblant per la llengua de signes en català?
Merci
He al·lucinat perquè efectivament hi ha alguna cosa de reconeixement de llenguatge de signes, però en "argentí" i tb hi ha un indi:
https://github.com/hthuwal/sign-language-gesture-recognition
https://github.com/emnikhil/Sign-Language-To-Text-Conversion
Sabeu si hi ha alguna cosa semblant per la llengua de signes en català?
Merci
Fundació Barcelona Media de la UPC
2. És programari lliure?
Whisper? Això és d'OpenAI. El codi i els models són lliures, però les dades emprades per a crear el model no ho són. Més informació sobre Whisper aquí: https://openai.com/blog/whisper/ i https://github.com/openai/whisper
Sysop: | Keyop |
---|---|
Location: | Huddersfield, West Yorkshire, UK |
Users: | 365 |
Nodes: | 16 (3 / 13) |
Uptime: | 25:51:36 |
Calls: | 7,748 |
Files: | 12,888 |
Messages: | 5,740,251 |