Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 24/03/2013, à 20:07

biospip

[RÉSOLU] comparer 2 textes pour détecter les plagiats

Bonjour,

je cherche à comparer 2 textes pour y trouver les parties communes.

La commande «comm» me permet de trouver les lignes communes mais, dans mon cas, je recherche des phrases ou des bouts de phrases qui auraient été plagiés. J'en ai trouvé plusieurs à la main mais j'aimerai pouvoir faire un état des lieux exhaustif de cette recopie (des phrases ont été recopiées et intégrées dans des paragraphes qui sont, eux, originaux, d'où la difficulté d'utiliser comm).

Pour la petite histoire, je cherche à récupérer des anciens cours que j'avais réalisé dans l'urgence et qui comprennent de nombreuses recopies dont je ne cite pas l'auteur d'origine. J'ai donc des plagias dans ces cours ce qui fait que je ne peux pas les publier sur internet comme j'en ai l'habitude.

Cdlt

Biospip

Dernière modification par biospip (Le 25/03/2013, à 18:41)


profil utilisateur Ubuntu-fr : http://doc.ubuntu-fr.org/utilisateurs/biospip

Hors ligne

#2 Le 24/03/2013, à 20:36

mydjey

Re : [RÉSOLU] comparer 2 textes pour détecter les plagiats

Bonjour,

Avec la commande diff ? peut-être pas super pour trouver les parties communes.

Ou encore avec le logiciel Meld ?

Ou encore avec du papier calque ? (private joke pour cette dernière soluce cool )

Dernière modification par mydjey (Le 24/03/2013, à 20:41)

Hors ligne

#3 Le 24/03/2013, à 21:48

biospip

Re : [RÉSOLU] comparer 2 textes pour détecter les plagiats

Bonjour et merci pour cette réponse,

en fait meld semble faire sensiblement la même chose que diff et comm mais en mode graphique et ne m'aide pas dans mon cas de figure car seules les phrases strictement identiques seront reconnues (si une phrase est identique mais collée à une autre phrase différente elle ne sera pas reconnue, il faut qu'il y ait un saut de ligne).

J'ai bien pensé au papier calque comme méthode à la mode chez les informaticiens chevronnés mais je ne suis qu'un newbie et cette nouvelle technologie me dépasse wink

Cdlt,

Biospip

Dernière modification par biospip (Le 24/03/2013, à 21:54)


profil utilisateur Ubuntu-fr : http://doc.ubuntu-fr.org/utilisateurs/biospip

Hors ligne

#4 Le 25/03/2013, à 01:30

nesthib

Re : [RÉSOLU] comparer 2 textes pour détecter les plagiats

Il y a similarity-tester dans les dépôts, mais je n'ai jamais testé.


GUL Bordeaux : GirollServices libres : TdCT.org
Hide in your shell, scripts & astuces :  applications dans un tunnelsmart wgettrouver des pdfinstall. auto de paquetssauvegarde auto♥ awk
  ⃛ɹǝsn xnuᴉꞁ uʍop-ǝpᴉsdn

Hors ligne

#5 Le 25/03/2013, à 13:02

biospip

Re : [RÉSOLU] comparer 2 textes pour détecter les plagiats

Merci, 
c'est exactement ce qu'il me fallait (commande sim_text).
Cdlt
Biospip


profil utilisateur Ubuntu-fr : http://doc.ubuntu-fr.org/utilisateurs/biospip

Hors ligne

#6 Le 25/03/2013, à 17:18

pingouinux

Re : [RÉSOLU] comparer 2 textes pour détecter les plagiats

Bonjour,
Voici aussi un programme python qui devrait faire l'affaire :

$ cat plagiat.py
#! /usr/bin/python
# -*- coding: utf-8 -*-

import sys

# Usage :
# ./plagiat.py fic1 fic2 N

# Lecture des paramètres
fic1, fic2, N = sys.argv[1:4]

# Ouverture des 2 fichiers
with open(fic1,'r') as f1, open(fic2,'r') as f2 :
 # Lecture des fichiers
   lst1=f1.read().split(); l1=len(lst1)
   lst2=f2.read().split(); l2=len(lst2)

# Création de 2 sets, dont on prendra l'intersection
s1=set()
s2=set()
n=int(N)
for k in range(l1-n+1) : s1.add(tuple(lst1[k:k+n]))
for k in range(l2-n+1) : s2.add(tuple(lst2[k:k+n]))

# Impression des résultats
i=0
for k in s1&s2 :
    i+=1
    sys.stdout.write("\n%3d) Séquence commune de %d mots\n"%(i,n))
    for j in k : sys.stdout.write("%s "%(j))
    sys.stdout.write("\n")

Utilisation :

./plagiat.py   fichier_1   fichier_2   nombre_de_mots_consécutifs_à_comparer

Par exemple :

./plagiat.py   fic1.txt   fic2.txt   10

Hors ligne

#7 Le 25/03/2013, à 18:43

biospip

Re : [RÉSOLU] comparer 2 textes pour détecter les plagiats

Un super merci pour ce programme python,

juste quand je me mets à la programmation python, ça tombe vraiment très bien,

Cdlt

Biospip


profil utilisateur Ubuntu-fr : http://doc.ubuntu-fr.org/utilisateurs/biospip

Hors ligne