Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 22/04/2018, à 23:27

Pam547

[Résolu] Regex, copier un même interval de plusieurs lignes.

Bonjour,

Je fais des recherches documentaire sur le web et vérifie avec « whois » les noms de domaine.
De plus en plus de sites proposant de l'information ou des renseignement sont anonymes et je préfère m'en méfier.

Alors je réussis à obtenir à partir d'une page de résultat de recherche un fichier txt avec des lignes ne comportant que des liens http :

	<a href="https://www.deco.fr/jardin-jardinage/actualite-842623-comment-entretenir-outils-jardin.html">Comment entretenir ses outils de jardin - deco.fr</a>
	<div class="resulturl"> https://www.deco.fr/jardin-jardinage/actualite-842623-comment...</div>
	<a href="https://www.cornerjob.com/fr/i/entretenir-outil-travail-equipement-essuyer-ranger-vaisselle-verreries-poste-30h-plus-KhtXI9YyPk/">Entretenir un outil de travail, un équipement et essuyer ...</a>
	<div class="resulturl"> https://www.cornerjob.com/fr/i/<b>entretenir</b>-<b>outil</b>-<b>travail</b>-equipement...</div>
	<a href="https://www.toutbricoler.com/outils-travail-menuiserie/">Tous les outils de travail d&#39;une menuiserie - Le Bricolage ...</a>
	<div class="resulturl"> https://www.toutbricoler.com/<b>outils</b>-<b>travail</b>-menuiserie</div>
	<a href="https://www.leborgne.fr/comment-faire/preparer-entretenir-son-potager.html">Préparer et entretenir son potager - Outils du bâtiment ...</a>
        [...] 

Je voudrais recopier dans un fichier txt ce qui est compris entre « :// » et « / » ; puis supprimer les doublons.

Entre les caractères spéciaux et sed que je suis loin de maîtriser, j'ai perdu courage et fait appelle à vous. ;)


Auriez-vous s'il vous plaît une piste, ou une solution à me proposer s'il vous plaît.

Merci pour votre attention.

Dernière modification par Pam547 (Le 23/04/2018, à 12:28)


Art.9.(code civil)  Chacun a droit au respect de sa vie privée.

Art.12.(déclaration universelle des DDH) Nul ne sera l'objet d'immixtions arbitraires dans sa vie privée, sa famille, son domicile ou sa correspondance, ni d'atteintes à son honneur et à sa réputation. Toute personne a droit à la protection de la loi contre de telles immixtions ou de telles atteintes.

Hors ligne

#2 Le 23/04/2018, à 00:11

Watael

Re : [Résolu] Regex, copier un même interval de plusieurs lignes.

salut,

/ n'est pas le seul séparateur possible.
s'il n'y a pas de substitution, il faut indiquer, au début, en le protégeant, le séparateur choisi.
par exemple : sed -n '\@motif@p' fichier

si il y a une substitution, il n'est pas nécessaire de protéger le séparateur choisi.


Connected \o/
Welcome to sHell. · eval is evil.

Hors ligne

#3 Le 23/04/2018, à 07:22

pingouinux

Re : [Résolu] Regex, copier un même interval de plusieurs lignes.

Bonjour,
Par exemple, avec ton fichier :

$ grep -o '//[^/]\+/' ton_fichier | sort -u
//www.cornerjob.com/
//www.deco.fr/
//www.leborgne.fr/
//www.toutbricoler.com/

Hors ligne

#4 Le 23/04/2018, à 12:22

Pam547

Re : [Résolu] Regex, copier un même interval de plusieurs lignes.

Bonjour,


C'est génial. smile J'espère en avoir fini avec mes difficultés à utiliser les expressions régulières (regex).

Merci beaucoup, et tout particulièrement à vous deux.


Bonne continuation. Au plaisir, à la satisfaction, à la récompense, à la justesse et au respect de vous « rencontrer » à nouveau.
(Morale soit disant universelle) Et vive l'application, l'exactitude et les soins.

Au revoir.


Art.9.(code civil)  Chacun a droit au respect de sa vie privée.

Art.12.(déclaration universelle des DDH) Nul ne sera l'objet d'immixtions arbitraires dans sa vie privée, sa famille, son domicile ou sa correspondance, ni d'atteintes à son honneur et à sa réputation. Toute personne a droit à la protection de la loi contre de telles immixtions ou de telles atteintes.

Hors ligne