#1 Le 24/03/2013, à 20:07
- biospip
[RÉSOLU] comparer 2 textes pour détecter les plagiats
Bonjour,
je cherche à comparer 2 textes pour y trouver les parties communes.
La commande «comm» me permet de trouver les lignes communes mais, dans mon cas, je recherche des phrases ou des bouts de phrases qui auraient été plagiés. J'en ai trouvé plusieurs à la main mais j'aimerai pouvoir faire un état des lieux exhaustif de cette recopie (des phrases ont été recopiées et intégrées dans des paragraphes qui sont, eux, originaux, d'où la difficulté d'utiliser comm).
Pour la petite histoire, je cherche à récupérer des anciens cours que j'avais réalisé dans l'urgence et qui comprennent de nombreuses recopies dont je ne cite pas l'auteur d'origine. J'ai donc des plagias dans ces cours ce qui fait que je ne peux pas les publier sur internet comme j'en ai l'habitude.
Cdlt
Biospip
Dernière modification par biospip (Le 25/03/2013, à 18:41)
profil utilisateur Ubuntu-fr : http://doc.ubuntu-fr.org/utilisateurs/biospip
Hors ligne
#2 Le 24/03/2013, à 20:36
- mydjey
Re : [RÉSOLU] comparer 2 textes pour détecter les plagiats
Bonjour,
Avec la commande diff ? peut-être pas super pour trouver les parties communes.
Ou encore avec le logiciel Meld ?
Ou encore avec du papier calque ? (private joke pour cette dernière soluce )
Dernière modification par mydjey (Le 24/03/2013, à 20:41)
Mon site : http://mydjey.eu/
Hors ligne
#3 Le 24/03/2013, à 21:48
- biospip
Re : [RÉSOLU] comparer 2 textes pour détecter les plagiats
Bonjour et merci pour cette réponse,
en fait meld semble faire sensiblement la même chose que diff et comm mais en mode graphique et ne m'aide pas dans mon cas de figure car seules les phrases strictement identiques seront reconnues (si une phrase est identique mais collée à une autre phrase différente elle ne sera pas reconnue, il faut qu'il y ait un saut de ligne).
J'ai bien pensé au papier calque comme méthode à la mode chez les informaticiens chevronnés mais je ne suis qu'un newbie et cette nouvelle technologie me dépasse
Cdlt,
Biospip
Dernière modification par biospip (Le 24/03/2013, à 21:54)
profil utilisateur Ubuntu-fr : http://doc.ubuntu-fr.org/utilisateurs/biospip
Hors ligne
#4 Le 25/03/2013, à 01:30
- nesthib
Re : [RÉSOLU] comparer 2 textes pour détecter les plagiats
Il y a similarity-tester dans les dépôts, mais je n'ai jamais testé.
GUL Bordeaux : Giroll – Services libres : TdCT.org
Hide in your shell, scripts & astuces : applications dans un tunnel – smart wget – trouver des pdf – install. auto de paquets – sauvegarde auto – ♥ awk
⃛ɹǝsn xnuᴉꞁ uʍop-ǝpᴉsdn
Hors ligne
#5 Le 25/03/2013, à 13:02
- biospip
Re : [RÉSOLU] comparer 2 textes pour détecter les plagiats
Merci,
c'est exactement ce qu'il me fallait (commande sim_text).
Cdlt
Biospip
profil utilisateur Ubuntu-fr : http://doc.ubuntu-fr.org/utilisateurs/biospip
Hors ligne
#6 Le 25/03/2013, à 17:18
- pingouinux
Re : [RÉSOLU] comparer 2 textes pour détecter les plagiats
Bonjour,
Voici aussi un programme python qui devrait faire l'affaire :
$ cat plagiat.py
#! /usr/bin/python
# -*- coding: utf-8 -*-
import sys
# Usage :
# ./plagiat.py fic1 fic2 N
# Lecture des paramètres
fic1, fic2, N = sys.argv[1:4]
# Ouverture des 2 fichiers
with open(fic1,'r') as f1, open(fic2,'r') as f2 :
# Lecture des fichiers
lst1=f1.read().split(); l1=len(lst1)
lst2=f2.read().split(); l2=len(lst2)
# Création de 2 sets, dont on prendra l'intersection
s1=set()
s2=set()
n=int(N)
for k in range(l1-n+1) : s1.add(tuple(lst1[k:k+n]))
for k in range(l2-n+1) : s2.add(tuple(lst2[k:k+n]))
# Impression des résultats
i=0
for k in s1&s2 :
i+=1
sys.stdout.write("\n%3d) Séquence commune de %d mots\n"%(i,n))
for j in k : sys.stdout.write("%s "%(j))
sys.stdout.write("\n")
Utilisation :
./plagiat.py fichier_1 fichier_2 nombre_de_mots_consécutifs_à_comparer
Par exemple :
./plagiat.py fic1.txt fic2.txt 10
Hors ligne
#7 Le 25/03/2013, à 18:43
- biospip
Re : [RÉSOLU] comparer 2 textes pour détecter les plagiats
Un super merci pour ce programme python,
juste quand je me mets à la programmation python, ça tombe vraiment très bien,
Cdlt
Biospip
profil utilisateur Ubuntu-fr : http://doc.ubuntu-fr.org/utilisateurs/biospip
Hors ligne