Ha davvero senso il plagiarism check, oggi? Una guida ragionata

Argomenti: ,
Pubblicato il: 17-12-2021 15:57

Il mondo del plagiarism check, ovvero la ricerca automatica di copie o scopiazzature diffuse sul web dei propri testi, conosce un’espansione enorme fin da quando si parla di internet e di SEO. Il software correttore del plagio, infatti, è uno strumento formalmente molto potente, e marketizzato (c’è da aggiungere) in una veste quasi “miracolistica”: non capita infatti mai di evidenziarne i limiti, nonostante essi ci siano, e soprattutto da quando la SEO (Search Engine Optimization) ha assunto valenza sempre più grande, è diventato una specie di must, quasi un “dovere morale”.

Ho sempre avuto perplessità su questo approccio, in effetti: da un lato, infatti, ho l’impressione che molta gente faccia leva esclusivamente su questi meccanismi per sentirsi tranquilla, senza considerare che la tecnologia a volte produce risultati ingannevoli. L’automation bias, in effetti, detto anche bias di automazione, è una vera e propria distorsione cognitiva che ci induce a credere, semplificando un po’ i termini, che ciò che vediamo su uno schermo, prodotto da un algoritmo, sia sempre e comunque da prendere come oro colato. Cosa che più falsa non si potrebbe, dato che esistono i bug e gli stessi programmatori di quei software potrebbero a loro volta essere affetti da vincoli progettuali biased (che servono a “far vedere al cliente” che le cose funzionano, anche quando non è vero per nulla).

Quando anni fa erano diffusi – parlo dei primi anni dopo il 2010 – software di scraping che servivano a ricopiare interi siti o parti degli stessi, il panico iniziò a diffondersi soprattutto perchè Google, in certi casi, valorizzava più la copia di un contenuto che l’originale, posizionandolo nei risultati prima dello stesso, in molte circostanze. Il plagiarism check viene anche usato per controllare che i testi prodotti dai copywriter siano veramente originali, per quanto poi uno potrebbe aver copiato da un libro offline, da una rivista e via dicendo. L’ottica in cui si muoveva Google era quasi certamente questa, o quasi, e comunque col tempo ha affinato un po’ la mira, usando criteri più “permissivi” e inducendo un meccanismo secondo il quale basta buttare dentro alle pagine web del testo, comunque esso sia e da qualsiasi parte sia preso, e va bene tutto. I cloni di Wikipedia sono, probabilmente, tra le più diffuse forme di duplicati in tal senso.

Se per far funzionare un software anti-plagio, infatti, basta confrontare le singole frasi, ad esempio a campione casuale, per verificare come stiano davvero le cose, a volte è comunque difficile capire “chi abbia copiato da chi”: questo perché è difficile datare un documento sul web, e la data che mette un sito (così come quella rilevata da Google) sono entrambi facili da manipolare maliziosamente. L’intelligenza artificiale ha dato un autentico scossone in tal senso, negli ultimi anni: è facile copiare “approssimativamente” un testo, fargli “prendere spunto” e produrre testi nuovi, anche grazie a tecnologie come GPT-3.

Un modo artigianale per produrre testi originali, del resto, è sempre stato quello di scrivere un testo in cui sostituiamo solo alcune delle parole chiave, generando una pagina per ogni chiave e variando al limite qualche altra parola: se parto dal testo

Buongiorno, oggi vedremo quali sono le migliori cuccie per cani.

qualsiasi studente di informatica anche delle scuole superiori saprebbe, in PHP ad esempio, generare delle pagine web con delle variazioni di quella (o di altre) frasi:

Buongiorno, oggi vedremo quali sono le migliori gabbie per uccellini.

Buonasera, in questo articolo vedremo quali sono le migliori custodie per cellulari.

Si butta dentro il link affiliato di Amazon ed ecco che nuovi “business” online prendono forma (in teoria). A parte che mi sono sempre chiesto quanta gente usi davvero questi siti in modo funzionale, Google ha sempre deprecato o sconsigliato questa pratica, perchè si tratta di un modo davvero banale per farsi penalizzare e molti programmi di affiliazione si basano su questo meccanismo.

SMSHosting Usa il codice PROMO per uno sconto sul primo acquisto: PRT96919

Un algoritmo di plagiarism detection, del resto, saprebbe riconoscere in modo molto raffinato siti web costruiti con questi criteri, e fin qui siamo d’accordo: ma poi come fai a reclamare il tutto? A quali leggi fai appello, se il sito ti copia dall’altra parte del mondo? Il diritto d’autore è già disciplina complicata di suo, e se due testi sono “vagamente simili” anche solo da punto di vista del significato non vuol dire, tra l’altro, che siano stati per forza copiati. Mille sfumature da considerare, insomma: e lo sa bene chi scrive i contenuti su Wikipedia, chi scrive i testi dell’ennesimo siti di “migliori prodotti”, lo sanno bene tutti: eppure ne parliamo ancora, ostinati, alla ricerca della “furbata” per guadagnare alle spalle delle “multinazionali”.

Fin quando poi, ovviamente, non veniamo penalizzati o peggio: e allora sì che dovremo preoccuparci. La ricerca di plagi è una disciplina già complessa per chi copia un libro altrui, ad esempio, e dubito a volte che le implementazioni dei software antiplagio riescano davvero a risolvere un problema così difficile da formalizzare, peraltro parametrico, con parametri stabiliti volta per volta e sui quali è difficile dare una valutazione di merito. Vale davvero la pena passare il proprio tempo a cercare plagi?

Ci fa davvero stare più tranquilli, dato che poi comunque possono copiarci i testi lo stesso, se siamo sul web? Secondo me, e chiudo un argomento che sarebbe infinito, l’approccio andrebbe un po’ rivisto. Con più buonsenso, meno funzionalismo e più voglia di fare qualcosa di veramente nuovo, ovviamente. Photo by Markus Winkler on Unsplash 


Questo articolo contiene 888 parole – Questo blog esiste da 3.646 giorni.
5/5 (2)

Che te ne pare?

Grazie per aver letto Ha davvero senso il plagiarism check, oggi? Una guida ragionata di Max Headroom su Trovalost.it
Ha davvero senso il plagiarism check, oggi? Una guida ragionata (Guide, Pensare, Zona Marketing)

Articoli più letti su questi argomenti:

Seguici su Telegram: @trovalost