bonsoir,
je veux savoir si lynx peut permettre l’automatisation de recherche ?
je cherche des plans de pièces d’hélicoptère, tél le plateau cyclique, et donc je veux orienter ma recherche sur patent, et faire un wget -m quand il y a un dessin, une image.
avez vous connaissance de recherche, veille sur ce type de fichiers ?
merci
—
ptilou
On 14/12/2021 16:26, ptilou wrote:
bonsoir,
je veux savoir si lynx peut permettre l’automatisation de recherche ?
je cherche des plans de pièces d’hélicoptère, tél le plateau cyclique, et donc je veux orienter ma recherche sur patent, et faire un wget -m quand il y a un dessin, une image.
avez vous connaissance de recherche, veille sur ce type de fichiers ?
A mon avis le problème est beaucoup plus complexe qu'on ne le croit, et pourrait faire l'objet d'une thèse de doctorat voire plusieurs d'entre eux (ou au moins un an de travail à temps plein).
En plus, le volume de données est important (Big Data, problèmatique de passage à l'échelle). Et les formats d'image sont nombreux (JPEG, PNG, SVG, etc etc etc...), et certaines sont générées en JavaScript.....
D'une part, les offices de brevets ont des équipes là dessus....
D'autre part, on pourrait utiliser un client HTTPS (libcurl) suivi d'une analyse d'image.
En France, je connais Mohamed Daoudi, professeur d'informatique à l'IMT Lille Douai, https://mohammeddaoudi.github.io/ spécialiste de ces questions.
Il faut bien sûr faire du deep learning.
Une possibilité serait de monter un consortium HorizonEurope sur ces questions. Je pourrais/voudrais y contribuer avec RefPerSys.. Contactez moi alors sur ma boîte professionnelle au CEA, LIST en basile.sta...@cea.fr
Il faut envisager une soumission HorizonEurope, avec un budget de plusieurs millions d'€ sur 2 ou 3 ans.
merci
sinon où trouver ou comment trouver les archives des sociétés qui n’existe
plus ? par exemple Bristol aéroplane ?
Tu peux te faire une moulinette en shell ou en Python qui parcourt le
site que tu veux et qui exécute un wget -m si nécessaire.
nicolas patrois : pts noir asocial
Le Tue, 14 Dec 2021 17:35:00 +0100,
nicolas...@gmail.com a écrit :
Tu peux te faire une moulinette en shell ou en Python qui parcourt le
site que tu veux et qui exécute un wget -m si nécessaire.
nicolas patrois : pts noir asocialC'était pas justement l'idée de Weboob de faire un navigateur-robot scriptable pour récupérer des choses et des infos ?
Slt,۪attaquer de ce c̫t̩ ?
Le jeudi 16 décembre 2021 à 03:00:03 UTC+1, Haricophile a écrit :
Le Tue, 14 Dec 2021 17:35:00 +0100,
nicolas...@gmail.com a écrit :
Tu peux te faire une moulinette en shell ou en Python qui parcourt le site que tu veux et qui exécute un wget -m si nécessaire.
Je ne connais pas mais à la grande époque y en avait en sécu informatique qui administrait la base dns de bind maison sur chaque entité, et je me demande puisqu’il s’agit d’une concordance entre des chiffres et de l’ACSII, si il pas mieux dânicolas patrois : pts noir asocialC'était pas justement l'idée de Weboob de faire un navigateur-robot scriptable pour récupérer des choses et des infos ?
Y a eu beautifulsoup en python....
Donc le mieux est de dl les sites puis de faire le trie ...
( pourtant si tu connais le fonctionnement d’internet avec ses data-center qui font ds miroir pour des histoires de gestion de bandes passante, ça m’étonnerait que quelqu’un Le face à la main ?)
—
Ptilou
wget -spider <url> qui permet de tout récupérer et faire le tri sur ce qui est intéressant.
faire un script qui récupérer la page d'accueil et la parcourt à la recherche des balises intéressantes pour y récupérer le contenu.
bonsoir,
je veux savoir si lynx peut permettre l’automatisation de recherche ?
je cherche des plans de pièces d’hélicoptère, tél le plateau cyclique, et donc je veux orienter ma recherche sur patent, et faire un wget -m quand il y a un dessin, une image.
avez vous connaissance de recherche, veille sur ce type de fichiers ?
merci
—
ptilou
bonjour
Si j'ai bien compris, tu veux récupérer les images d'un site web? Plusieurs cas :
wget -spider <url> qui permet de tout récupérer et faire le tri sur ce qui est intéressant.
faire un script qui récupérer la page d'accueil et la parcourt à la recherche des balises intéressantes pour y récupérer le contenu.
amitiés
Erwann
Le Tue, 14 Dec 2021 07:26:45 -0800 (PST)
ptilou <pti...@gmail.com> a écrit :
bonsoir,
je veux savoir si lynx peut permettre l’automatisation de recherche ?
je cherche des plans de pièces d’hélicoptère, tél le plateau cyclique, et donc je veux orienter ma recherche sur patent, et faire un wget -m quand il y a un dessin, une image.
avez vous connaissance de recherche, veille sur ce type de fichiers ?
merci
—
ptilou
--
<p>amiti_s,</p>
-- <br>
<p>Erwann</p>
Slt,publication avec mille, j’ai pas eu de réponse’ du lug de Renne c’est la’ biblio de’ l’inra a Renne d’après Sudoc.
https://cours.univ-paris1.fr/mod/page/view.php?id=594895
J’ai trouvé ça ! Bon ça fait avancer ....
Je n’ai pas le’ temps pour faire le script, mais je me demande si la’ machine n’a pas un problème, enfin et donc j’avais lancer une demande pour obtenir le dvd’ au 6000 script, il m’en semble que cette année le magazine a fait une
Comme c’est gpl et fêtes ....
J’ai chercher dans les bases de données modèle et dessins et rien d’en concluant ?
Mais se que j’ai dit plus haut, la veille était fêtes avant les fil rss, et donc je m’en demande si elle passait par un moteur de recherche, ou s’il elle attaque pas’ direct la base de bind ?
(Faut trouver quelqu’un qui partage )
Merci
Le jeudi 23 décembre 2021 à 10:50:03 UTC+1, Erwann Le Bras a écrit :
bonjour
Si j'ai bien compris, tu veux récupérer les images d'un site web? Plusieurs cas :
wget -spider <url> qui permet de tout récupérer et faire le tri sur ce qui est intéressant.
faire un script qui récupérer la page d'accueil et la parcourt à la recherche des balises intéressantes pour y récupérer le contenu.
amitiés
Erwann
Le Tue, 14 Dec 2021 07:26:45 -0800 (PST)
ptilou <pti...@gmail.com> a écrit :
bonsoir,
je veux savoir si lynx peut permettre l’automatisation de recherche ? je cherche des plans de pièces d’hélicoptère, tél le plateau cyclique, et donc je veux orienter ma recherche sur patent, et faire un wget -m quand il y a un dessin, une image.
avez vous connaissance de recherche, veille sur ce type de fichiers ?
merci
—
ptilou
--
<p>amiti_s,</p>
-- <br>
<p>Erwann</p>—
Ptilou
Sysop: | Keyop |
---|---|
Location: | Huddersfield, West Yorkshire, UK |
Users: | 286 |
Nodes: | 16 (2 / 14) |
Uptime: | 90:01:02 |
Calls: | 6,496 |
Calls today: | 7 |
Files: | 12,100 |
Messages: | 5,277,558 |