<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
	<channel>
		<atom:link href="http://forum.ubuntu-fr.org/extern.php?action=feed&amp;tid=1126171&amp;type=rss" rel="self" type="application/rss+xml" />
		<title><![CDATA[Forum Ubuntu-fr.org / [Résolu] Awk, extraction d'un groupe de lignes suivant le résultat]]></title>
		<link>http://forum.ubuntu-fr.org/viewtopic.php?id=1126171</link>
		<description><![CDATA[Les sujets les plus récents dans [Résolu] Awk, extraction d'un groupe de lignes suivant le résultat.]]></description>
		<lastBuildDate>Wed, 05 Dec 2012 17:25:21 +0000</lastBuildDate>
		<generator>FluxBB</generator>
		<item>
			<title><![CDATA[Réponse à&#160;:  [Résolu] Awk, extraction d'un groupe de lignes suivant le résultat]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11761431#p11761431</link>
			<description><![CDATA[<p>Je rejoins Totor sur cette méthode, et si jamais tu veux en profiter pour joindre ta séquence ADN en une seule suite de caractères :</p><div class="codebox"><pre><code>awk -v RS=&quot;&gt;&quot; -v ORS=&quot;\n&quot; -v FS=&#039;\n&#039; -v OFS=&quot;&quot; &#039;/transcript_biotype:rRNA/ {$1=$1&quot; &quot;;print &quot;&gt;&quot;$0}&#039; fichier</code></pre></div><p>Et pour avoir un format <a href="https://fr.wikipedia.org/wiki/FASTA">FASTA</a> :</p><div class="codebox"><pre><code>awk -v RS=&quot;&gt;&quot; -v ORS=&quot;\n&quot; -v FS=&#039;\n&#039; -v OFS=&quot;&quot; &#039;/transcript_biotype:rRNA/ {$1=$1&quot;\n&quot;;print &quot;&gt;&quot;$0}&#039; fichier</code></pre></div>]]></description>
			<author><![CDATA[dummy@example.com (nesthib)]]></author>
			<pubDate>Wed, 05 Dec 2012 17:25:21 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11761431#p11761431</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  [Résolu] Awk, extraction d'un groupe de lignes suivant le résultat]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11748321#p11748321</link>
			<description><![CDATA[<p>bonsoir,<br />une autre approche :</p><div class="codebox"><pre><code>awk -v RS=&quot;&gt;&quot; -v ORS=&quot;&quot; &#039;/transcript_biotype:rRNA/ {print &quot;&gt;&quot;$0}&#039; test.txt</code></pre></div>]]></description>
			<author><![CDATA[dummy@example.com (Totor)]]></author>
			<pubDate>Tue, 04 Dec 2012 17:57:30 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11748321#p11748321</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  [Résolu] Awk, extraction d'un groupe de lignes suivant le résultat]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11737681#p11737681</link>
			<description><![CDATA[<p>Merci.</p>]]></description>
			<author><![CDATA[dummy@example.com (Doublecafe)]]></author>
			<pubDate>Mon, 03 Dec 2012 20:17:11 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11737681#p11737681</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  [Résolu] Awk, extraction d'un groupe de lignes suivant le résultat]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11737661#p11737661</link>
			<description><![CDATA[<p>Voici la logique des opérations :</p><div class="quotebox"><blockquote><div><p>Boucle sur toutes les lignes<br />&#160; &#160; &#160;Si la ligne commence par <strong>&gt;ENSAMET</strong><br />&#160; &#160; &#160; &#160; &#160; &#160;Si elle finit aussi par <strong>transcript_biotype:rRNA</strong><br />&#160; &#160; &#160; &#160; &#160; &#160; &#160; &#160; ok=1<br />&#160; &#160; &#160; &#160; &#160; &#160;Sinon<br />&#160; &#160; &#160; &#160; &#160; &#160; &#160; &#160; ok=0<br />&#160; &#160; &#160;Si <strong>ok=1</strong><br />&#160; &#160; &#160; &#160; &#160; &#160; On imprime la ligne</p></div></blockquote></div>]]></description>
			<author><![CDATA[dummy@example.com (pingouinux)]]></author>
			<pubDate>Mon, 03 Dec 2012 20:14:01 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11737661#p11737661</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  [Résolu] Awk, extraction d'un groupe de lignes suivant le résultat]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11736791#p11736791</link>
			<description><![CDATA[<p>@pingouinux:<br />Merci beaucoup, c&#039;est exactement ce que je voulais. C&#039;est vrai que l&#039;extrait que j&#039;ai affiché portait à confusion.<br />J&#039;ai un dernier service à te demander: pourrais-tu me commenter ta commande si ce n&#039;est pas trop demander? Ça me permettrait de la comprendre et ainsi de pouvoir l&#039;utiliser ultérieurement.</p>]]></description>
			<author><![CDATA[dummy@example.com (Doublecafe)]]></author>
			<pubDate>Mon, 03 Dec 2012 19:27:19 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11736791#p11736791</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  [Résolu] Awk, extraction d'un groupe de lignes suivant le résultat]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11736191#p11736191</link>
			<description><![CDATA[<p>@Doublecafe :<br />C&#039;est exact, je n&#039;avais pas testé ce cas-là, désolé. Voici la version corrigée :</p><div class="codebox"><pre><code>awk &#039;/^&gt;ENSAMET/{if($0~/transcript_biotype:rRNA$/) ok=1; else ok=0} {if(ok) print}&#039; fichier</code></pre></div>]]></description>
			<author><![CDATA[dummy@example.com (pingouinux)]]></author>
			<pubDate>Mon, 03 Dec 2012 18:44:36 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11736191#p11736191</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  [Résolu] Awk, extraction d'un groupe de lignes suivant le résultat]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11735971#p11735971</link>
			<description><![CDATA[<p>Merci beaucoup pour vos réponses ,</p><p>@aduxas: Ta commande supprime malheureusement les en-tête.</p><p>@pingouinux: Ta commande fonctionne à merveille, le seul bémol ce sont les résultats qui ne s&#039;arrêtent pas à la dernière séquence de rRNA trouvée mais continuent jusqu&#039;à la fin du fichier.</p><p>Je vous link le fichier (texte compréssé en .gz) si vous voulez voir à quoi ça ressemble en entier (génotype du Panda d&#039;où provient l&#039;extrait de mon post initial): <a href="ftp://ftp.ensembl.org/pub/release-69/fasta/ailuropoda_melanoleuca/ncrna/Ailuropoda_melanoleuca.ailMel1.69.ncrna.fa.gz">Ailuropoda_melanoleuca_ncRNA</a></p>]]></description>
			<author><![CDATA[dummy@example.com (Doublecafe)]]></author>
			<pubDate>Mon, 03 Dec 2012 18:31:43 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11735971#p11735971</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  [Résolu] Awk, extraction d'un groupe de lignes suivant le résultat]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11735931#p11735931</link>
			<description><![CDATA[<p>@aduxas #2 :<br />Ta commande ne donne pas tout-à-fait le résultat souhaité. Si tu as 2 séquences consécutives à conserver, la seconde est omise. Doublecafe voulait aussi conserver la première ligne des bonnes séquences.</p>]]></description>
			<author><![CDATA[dummy@example.com (pingouinux)]]></author>
			<pubDate>Mon, 03 Dec 2012 18:28:30 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11735931#p11735931</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  [Résolu] Awk, extraction d'un groupe de lignes suivant le résultat]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11735691#p11735691</link>
			<description><![CDATA[<p>Bonsoir,<br />Autre solution, avec <strong>awk</strong> :</p><div class="codebox"><pre><code>awk &#039;/^&gt;ENSAMET/{$0~/transcript_biotype:rRNA$/ &amp;&amp; ok=1 || ok=0} {if(ok) print}&#039; fichier</code></pre></div><p><span class="bbu">Corrigé</span> : La commande ci-dessus est erronée, à cause de la précédence des opérateurs&#160; (voir les messages #5 et #6)<br />Voici la bonne :</p><div class="codebox"><pre><code>awk &#039;/^&gt;ENSAMET/{$0~/transcript_biotype:rRNA$/ &amp;&amp; (ok=1) || (ok=0)} {if(ok) print}&#039; fichier</code></pre></div><p>Celle-ci est correcte également (identique à celle de #6) :</p><div class="codebox"><pre><code>awk &#039;/^&gt;ENSAMET/{if($0~/transcript_biotype:rRNA$/) ok=1; else ok=0} {if(ok) print}&#039; fichier</code></pre></div>]]></description>
			<author><![CDATA[dummy@example.com (pingouinux)]]></author>
			<pubDate>Mon, 03 Dec 2012 18:14:54 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11735691#p11735691</guid>
		</item>
		<item>
			<title><![CDATA[Réponse à&#160;:  [Résolu] Awk, extraction d'un groupe de lignes suivant le résultat]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11735531#p11735531</link>
			<description><![CDATA[<div class="codebox"><pre><code>sed -n &#039;/transcript_biotype:rRNA/,/ENSAMET/p&#039; fichier | sed &#039;/ENSAMET/d&#039;</code></pre></div>]]></description>
			<author><![CDATA[dummy@example.com (aduxas)]]></author>
			<pubDate>Mon, 03 Dec 2012 18:07:27 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11735531#p11735531</guid>
		</item>
		<item>
			<title><![CDATA[[Résolu] Awk, extraction d'un groupe de lignes suivant le résultat]]></title>
			<link>http://forum.ubuntu-fr.org/viewtopic.php?pid=11735261#p11735261</link>
			<description><![CDATA[<p>Bonjour,</p><p>J&#039;ai pour projet la création d&#039;un petit script me permettant le téléchargement de séquences génétiques précises depuis une base de données.<br />Le fichier &quot;brut&quot; une fois téléchargé doit être filtré pour ne retenir qu&#039;une seule catégorie de séquence (pour info: les rRNA).<br />Voici un extrait du fichier &quot;brut&quot; (n&#039;oubliez pas de scroller vers la droite, la partie &quot;interessante&quot; se trouve à ce niveau là smile ) : </p><div class="codebox"><pre><code>&gt;ENSAMET00000025279 mt_genbank_import:Mt_tRNA scaffold:ailMel1:MT:16669:16740:1 gene:ENSAMEG00000023456 gene_biotype:Mt_tRNA transcript_biotype:Mt_tRNA
GTCTTTGTAGTATATTAATTACTTTGGTCTTGTAAACCAAAAACGGAGATTCCTCTACTT
CTCCCTAAGACT
&gt;ENSAMET00000025280 mt_genbank_import:Mt_tRNA scaffold:ailMel1:MT:16740:16805:1 gene:ENSAMEG00000023457 gene_biotype:Mt_tRNA transcript_biotype:Mt_tRNA
TCAAGGAAGGAGCAACAACCCCACTACCAGCACCCAAAGCTGGTGTTCTACTTAAACTAT
CCCCTG
&gt;ENSAMET00000024058 ncrna:rRNA scaffold:ailMel1:GL192670.1:1084758:1084883:1 gene:ENSAMEG00000022235 gene_biotype:rRNA transcript_biotype:rRNA
TCAGAGAGTGTTACAGACCTCCTCCCTCAAACTGTGATCTTGTCAGATCTCATAAGCCAA
ACAAAGTTGGGGCTGGGTGTGTACTTGGATAAGAGGACTATTGAGGAAAAATTAGCATTT
TCTGGT
&gt;ENSAMET00000023247 ncrna:rRNA scaffold:ailMel1:GL193102.1:202330:202448:1 gene:ENSAMEG00000021424 gene_biotype:rRNA transcript_biotype:rRNA
GTCTACGGCCATACCACCCTGAAAGCGCCTGATCTTGTCTCATCTCAGAAGCTAAGCAGG
GTCGGGCCTGGTTAGTACTTGGATGGGAGTCCTTCTTTACATCCAGTCAACAAAAGAAC
&gt;ENSAMET00000022436 ncrna:rRNA scaffold:ailMel1:GL194145.1:234859:234983:1 gene:ENSAMEG00000020613 gene_biotype:rRNA transcript_biotype:rRNA
GTCTACGGCCATACCACCCTGAATGCTCCCGATCTCGTCTGATCTCGGAAGCTAAGCAGG
GTTGGACCTGGTTAGTACTTGGATGGGAAGTGAGGGCTCTCAAAAGCCTTTTGGTAGTGT
ATCCA
&gt;ENSAMET00000022443 ncrna:rRNA scaffold:ailMel1:GL192363.1:4052156:4052274:1 gene:ENSAMEG00000020620 gene_biotype:rRNA transcript_biotype:rRNA
GTTTATGGCCATATCACCCTGAAGGAGCCCGATCTCATCTGATCTGGGAAGTTAAGCAGG
GTCAGGCCTGGTTAGTACGTAGATGGGATTCCGCCTGGGAATACTGGCTGCTGTGGGCT</code></pre></div><p>J&#039;aimerais sélectionner dans cet extrait toutes les séquences &quot;rRNA&quot;, elle se situent après la ligne contenant &quot;transcript_biotype:rRNA&quot; (ligne incluse car elle possède les identifiants du gène).<br />J&#039;ai pensé&#160; à l&#039;utilisation de la commande: grep -A &quot;transcript_biotype:rRNA&quot;, cependant le nombre de ligne après cette chaîne de caractères est aléatoire .</p><p>En résumé voilà pourquoi j&#039;ai besoin de vous :</p><p>J&#039;aimerais sélectionner toutes les parties entre la ligne possédant la chaîne de caractères &quot;transcript_biotype:rRNA&quot; (ligne incluse) et le &quot;&gt;ENSAMET&quot; suivant (exclu car c&#039;est l&#039;en-tête de la séquence suivante).</p><p>Merci par avance pour vos propositions.</p><p><em>edit modo : message restauré.<br />Merci de respecter les contributeurs de ce forum, ce n&#039;est pas une hotline et les questions doivent être préservées pour le bien commun.<br />Pour toute remarque → moderateurs [at] ubuntu-fr [point] org</em></p>]]></description>
			<author><![CDATA[dummy@example.com (Doublecafe)]]></author>
			<pubDate>Mon, 03 Dec 2012 17:57:15 +0000</pubDate>
			<guid>http://forum.ubuntu-fr.org/viewtopic.php?pid=11735261#p11735261</guid>
		</item>
	</channel>
</rss>
