Programes de detecció de plagi: aspectes lingüístics, legals i educatius del seu ús — Cristóbal Urbano i Amadeu Pons

Durant la tardor de 2018, uns quants noms comercials de programes informàtics de detecció de plagi, com ara Turnitin, Urkund o PlagScan, entre d’altres, van ser ben presents als mitjans de comunicació espanyols. De cop i volta, arribaven amb força a Espanya alguns casos mediàtics sobre plagi acadèmic de personalitats del món polític, que ja havien estat tot un clàssic des de feia anys arreu del món —com ho proven els casos de les dimissions per plagi de ministres del Govern alemany.[1] Si bé ja feia anys que diverses situacions de plagi en publicacions acadèmiques per part d’autoritats universitàries espanyoles havien circulat en els mitjans —com ara el cas judicialitzat de l’exrector Fernando Suárez—,[2] el focus sobre els polítics va suscitar a principis de setembre de 2018 l’interès dels periodistes: Carmen Montón, ministra de Sanitat, dimitia per una acusació de plagi en el seu treball final de màster, que els mitjans van analitzar detalladament sota la lupa del programa Turnitin.[3]

Amb la seva dimissió, la ministra va deixar de funcionar com a “fusible” d’altres possibles casos en el Govern. L’oposició en el Congrés dels Diputats va reclamar l’anàlisi de la tesi doctoral del president del Govern, Pedro Sánchez, sobre la qual hi havia rumors de plagi, ja que de forma sorprenent respecte al que és ja habitual en els darrers anys entre la majoria persones que es doctoren, no l’havia difós digitalment en un repositori acadèmic, i les condicions de consulta de la versió en paper a la biblioteca de la Universitat Camilo José Cela eren força restrictives.[4] La reacció de la Moncloa va ser pujar la versió digital de la tesi per a la seva consulta lliure a TESEO[5] i encarregar directament l’aplicació dels programes Turnitin i PlagScan, amb un resultat d’originalitat del treball del president suficientment elevat —un cop descomptades les citacions correctament documentades— per descartar l’acusació.[6]

Tota aquesta atenció mediàtica sobre aquests casos va servir per posar de manifest la complexitat i els condicionants que s’han de tenir presents en fer ús de programari per a la detecció de plagi acadèmic, com bé deia Lluís Val a ElDiario.es: “Tratar de subjetivizar cualquier escenario de plagio a un criterio numérico es un error. Hay que mirar los datos, analizarlos, y estudiar el trabajo con mucha atención”.[7]

A partir d’aquests fets, destaquem alguns aspectes lingüístics, legals, educatius i d’estil editorial necessaris per a un bon ús d’aquestes aplicacions informàtiques, que s’han de considerar eines per determinar en quina mida i intensitat determinats autors o alumnes han conjugat el verb “plagiar”, acció que segons defineix el Diccionari de la llengua catalana consisteix a “copiar (idees, paraules, obres, etc., d’una altra persona) usant-les com a pròpies” i que segons el Diccionari de sinònims d’Albert Jané, publicat en la seva 3a edició en el web de l’IEC, s’associa amb els verbs “copiar, imitar, calcar, afusellar”. Aquests sinònims inviten a veure el plagi com una acció amb nivells d’intensitat ben diversos, però també com un comportament que sempre implica una acció d’un subjecte que difícilment pot justificar ignorància sobre la seva conducta.

 Aspectes lingüístics

Aquests programes comparen el text analitzat amb una mostra àmplia de documents de tot tipus presents a internet (premsa, revistes científiques, llibres, obres de consulta, planes web, textos legals, etc.), complementada amb el conjunt de textos recollits per l’aplicació a partir del dipòsit que conscientment o inconscient fan altres usuaris que han utilitzat el mateix programa amb anterioritat. A banda d’identificar cadenes de caràcters idèntiques, també poden identificar paràgrafs sencers similars que malgrat que no siguin idèntics poden ser molt semblants.

Ara bé, l’aplicació d’un programa d’aquest tipus no pot estalviar una lectura estratègicament avaluativa del treball acadèmic, o del manuscrit sotmès a revisió per a la seva possible publicació. No ens podem quedar amb el tant per cent de similitud que presenti el text objecte d’anàlisi respecte de les fonts digitals que controla el programa. Cal discriminar el tipus de similitud i cal seguir analitzant a mà possibles fragments que són indetectables per la màquina. Així, tot i que el programa no els detecti, es poden trobar fragments que siguin motiu de sospita per a un docent o un revisor editorial amb experiència, ja que es poden observar variacions sobtades de l’estil de redacció, del registre lingüístic o del nivell intel·lectual respecte d’altres parts del manuscrit, com també incorreccions lingüístiques directament imputables a la realització de traduccions literals o automàtiques des d’altres llengües, totes elles circumstàncies que acostumen a ser un indici per investigar un possible plagi.

En aquest sentit, cal fer una menció especial als problemes que aquestes eines informàtiques de detecció tenen per traçar similituds de textos corresponents a matèries i llengües en les quals el volum de documents digitalitzats disponibles a internet és menor (com passa sovint en les humanitats i el dret). També passa el mateix amb l’eficàcia relativa que pot tenir aplicar aquests programes a treballs redactats en català, quan la major part de la bibliografia digitalitzada sobre el tema del treball no es troba en aquesta llengua.

D’altra banda, un percentatge elevat de similitud pot ser causat per la presència de fragments citats correctament que la configuració dels programes no ha permès sostreure del percentatge de solapament, ja que l’ús de les cometes pot ser molt variat i pot no estar acotat a delimitar els textos citats. També poden haver-hi citacions no literals, o poden haver-hi citacions extenses en forma de paràgrafs sagnats que no siguin fàcils d’aïllar en configurar el programa.

Aspectes legals

Un manuscrit no publicat que s’envia per a l’avaluació d’una revista o d’una editorial, així com un treball acadèmic presentat per un alumne, no són d’entrada documents públics. Sobre aquest tipus de manuscrits hi ha tot un seguit de drets morals, intel·lectuals i de preservació de la intimitat, que obliguen a tractar-los dins dels esmentats programes de forma anonimitzada si s’hi dipositen. S’ha de vigilar, doncs, la configuració dels programes de detecció de plagi, ja que altrament terceres persones poden accedir a aquests documents sense coneixement ni autorització dels seus autors.

D’altra banda, el context d’ús d’aquests programes per part d’institucions educatives està condicionat per la reglamentació acadèmica aplicable que pot marcar el tipus de sanció que mereix el plagi, en funció de la dimensió que tingui i dels elements probatoris emprats. És a dir, cal establir el volum i la fiabilitat de les evidències de plagi de cara a aplicar un determinat règim sancionador. Ara bé, en aquesta qüestió la manca de definició del marc legal acadèmic i un volum insuficient de jurisprudència sobre situacions conflictives de plagi en treballs d’alumnat, dificulta la tasca normativa de les universitats, que a hores d’ara presenten una gran diversitat i manca de concreció en el tractament que donen al problema en els seus estatuts o en els seus reglaments acadèmics interns.

Des del punt de vista dels drets d’autor en l’àmbit de l’edició acadèmica, la jurisprudència demostra que no és fàcil la condemna del plagiari i sovint no s’arbitren mesures per restituir els drets morals: s’ha de tenir present que no es poden retirar de la circulació els textos suposadament fraudulents si no es prenen mesures cautelars, o si els editors no ho fan per iniciativa pròpia. Si bé els codis ètics i la mateixa naturalesa de les revistes han consolidat la figura de l’article retractat, en el món dels llibres aquesta figura no està tan present i les editorials haurien de ser més diligents i exigents.

Cal esperar que la magnitud del fenomen i l’alarma social i mediàtica que han causat els casos que hem esmentat al començament facin avançar en operativitat les respostes judicials, administratives o d’ètica institucional al plagi, sigui en l’esfera acadèmica o editorial.

Aspectes educatius i models de comunicació acadèmica

En el món acadèmic som hereus de la tradició de la citació bibliogràfica, establerta entre els segles XVII i XVIII, que obliga a documentar correctament la font de tots aquells fragments de text o dades aliens que es reutilitzen de forma literal o parafrasejada en una nova publicació. És una tradició que permet un ús limitat de les obres d’altri, emparat en el dret de citació, que entenem com una limitació al dret de propietat intel·lectual. Consisteix en un reconeixement del crèdit que donem als autors en els quals ens basem per generar nou coneixement, tal com afirmava Newton a la seva famosa frase “if I have seen further, it is by standing on the shoulders of giants”,[8] que apareix actualment com a lema a la pàgina d’inici del cercador de bibliografia acadèmica Google Scholar.

Ara bé, en un món digital d’informació abundant i altament disponible sobre qualsevol tema, sota formes documentals i mencions d’autoria molt diverses i en ocasions poc clares, cal reforçar aquesta tradició, educar en la cultura i l’ètica acadèmica, de la creativitat i l’originalitat davant de la facilitat que presenta el “cut and paste” i la seva justificació en la suposada “intertextualitat” natural de la producció de textos en l’actualitat. És en aquest terreny que els programes de detecció de plagi poden ser un recurs educatiu i dissuasiu respecte d’aquesta mala pràctica, i no tant un mer instrument per fonamentar la via punitiva.

Sigui perquè els alumnes o els autors es basen en una major o menor mesura en altres autors en funció del tipus de text que estiguin elaborant, o bé pel volum tan elevat de coneixement comú disponible, no és fàcil elaborar textos de nova creació amb una originalitat total, si bé la coincidència exacta i casual de cadenes llargues de caràcters és altament improbable. Per això, si el que s’espera dels autors i estudiants són aportacions originals i rellevants, cal pensar en una producció de textos, d’elements de comunicació acadèmica o àdhuc professional, que ajudi a centrar l’esforç en la creació original, basada en la lectura de textos aliens, però no en la integració extensa de continguts aliens en forma de síntesi, sinó pastitxos, que no són ni útils ni educatius. En enfocaments docents d’aquest tipus, sovint s’invita que els alumnes mateixos passin el programa de detecció de plagi abans de lliurar els treballs, per mesurar l’originalitat requerida i evitar tant el plagi com l’excés de fragments correctament citats. En aquest model d’ús dels programes, el professor reclama a l’alumne un treball no massa extens, i li marca un grau màxim de solapaments amb altres fonts dins d’una extensió màxima ben especificada, encara que estiguin ben citats. Es fa prevaldre la creació i la qualitat del discurs propi, o de les evidències d’investigació obtingudes, davant de l’extensió del treball.

La potència del programa, doncs, parteix del seu valor dissuasiu, informatiu i formatiu: no es tracta tant de trobar plagis com d’evitar-los en origen. És a dir, fent aquest ús més complet del programa es mostra als alumnes que la institució disposa de l’instrument per controlar el plagi, però fent-los arribar el missatge que el que realment es vol és ajudar-los a evitar-lo abans de l’entrega definitiva del treball.

L’originalitat com a resposta a la infoxicació… i de retruc al plagi

En el món acadèmic i editorial resulta cada cop més necessari un model de comunicació científica i un model d’avaluació acadèmica que aposti per produccions de textos clars, sintètics i breus, que no es remuntin a antecedents històrics inacabables, i que no facin una contextualització de la recerca més extensa que la recerca mateixa.

Vivim una època marcada per l’economia de l’atenció, en la qual el temps és un bé més escàs que no pas la informació, i on cal triar molt bé què llegim o què escrivim. És per això que cal invitar els alumnes i autors a evitar els “refregits”, que sovint estan destinats a omplir l’extensió mínima que els docents demanen per optar a l’aprovat. Les revisions bibliogràfiques inacabables, els contextos històrics i socials en treballs de grau que ocupen més que la recerca original mateixa feta per l’alumne, sovint es poden arribar a emmirallar en publicacions en forma de llibres i revistes ben reconegudes que freqüentment abusen del mateix.

Universitat de Barcelona. Departament de Biblioteconomia, Documentació i Comunicació Audiovisual

[1] Revuelta, Enric. (30 de juliol de 2013). El plagi de part de la tesi doctoral, una plaga entre polítics europeus. Ara. Consultat des de https://www.ara.cat/internacional/plagi-coneguts-treballs-academics-politics_0_965303667.html

[2] Sánchez Caballero, Daniel. (20 d’octubre de 2017). Un juzgado investigará al exrector de la Rey Juan Carlos por los plagios. ElDiario.es. Consultat des de https://www.eldiario.es/sociedad/Madrid-investiga-Rey-Juan-Carlos_0_698881212.html

[3] Useros, Vicente. (14 de setembre de 2018). El sistema ‘antiplagio’ confirma que Carmen Montón copió el 58% de su TFM. El Mundo. Consultat des de https://www.elmundo.es/comunidad-valenciana/2018/09/14/5b9aa65ae2704ebb628b4579.html

[4] EFE. (13 de setembre de 2018). La Universidad Camilo José Cela dice que la tesis de Pedro Sánchez cumple con la normativa vigente. El Mundo. Consultat des de https://www.elmundo.es/espana/2018/09/13/5b9a6c54e2704e7e3b8b4637.html

[5] Pérez-Castejón Sánchez, Pedro. (2012). Innovaciones de la diplomacia económica española: Análisis del sector público (2000-2012). (Tesi doctoral, Universidad Camilo José Cela, Espanya). Consultat des de https://dialnet.unirioja.es/servlet/tesis?codigo=150675

[6] La tesis del presidente Sánchez supera ampliamente los softwares de coincidencias. [nota de premsa] (14 de setembre de 2018). La Moncloa, Gobierno de España. Consultat des de https://www.lamoncloa.gob.es/serviciosdeprensa/notasprensa/presidencia/Paginas/2018/140918tesis_presi.aspx

[7] De Diego, Matías. (13 de setembre de 2018). Así funcionan los sistemas para detectar plagios en los trabajos universitarios. ElDiario.es. Consultat des de https://www.eldiario.es/sociedad/funcionan-sistemas-detectar-trabajos-universitarios_0_814019151.html

[8] https://digitallibrary.hsp.org/index.php/Detail/objects/9792

Deixa un comentari