I made the sweeping assertion at Berlin5 that no-one other than me was blogging (I asked for a show of hands), and am delighted to be proved wrong:
Paolo Gardois Says:
September 24th, 2007 at 3:30 pm e
Firstly, compliments for your presentation, it was great!!
Secondly, I was at Berlin 5, blogging the meeting, so you should feel a little less sad… Our blog is in Italian, but if you want to take a look: http://unitosbd.wordpress.com .
Please let us know what you think…
PMR: Paolo has done a great job and blogged every session.
Peter Murray Rust, scienziato di Cambridge e blogger prosegue con un paper sulla publicità dei dati di ricerca, partendo dall’esempio dei dati su inquinamento e riscaldamento climatico. Dopo l’imperdibile citazione di Tufte (”Power Corrupts. PowerPoint Corrupts Absolutely“), Rust prosegue delineando l’onnipresenza del copyright, sia nelle tabelle e grafici pubblicati dentro gli articoli scientifici di editori commerciali, sia nei database (es. ACS).
Ora, un aspetto dell’open access riguarda il libero accesso all’informazione, ma un altro riguarda la possibilità di riuso dei dati. Non sempre le 2 cose sono collegate, e questo costituisce un problema per gli scienziati, che generano nuova conoscenza letteralmente manipolando e riconfigurando dati pubblicamente disponibili. Una soluzione è rappresentata dall’attrivuire un’esplicita licenza relativa all’utilizzo dei dati (es. Science Commons).
Anche le tesi di dottorato dovrebbero essere rilasciate secondo modelli di licenza simili (vedi l’iniziativa di Harvard).
Su un altro versante, si incontrano difficoltà anche tecniche nell’estrarre i dati (formule, ecc.) dalle pubblicazioni per poterle riutilizzare. Non è solo un problema di copyright, dunque, ma anche di formati. Occorre dunque pubblicare i dati grezzi in formati standard in repository pubblici, e parallelamente sviluppare strumenti di text mining – estrazione automatica di dati da file di testo – ovviamente XML, non PDF che distrugge la scienza
Un es. di questi strumenti, utile per l’annotazione semantica di articoli di chimica, è OSCAR3.
Ma comunque, ironia a parte, quanto detto qui sui formati chiusi riecheggia quello che ho scritto ieri sui documenti chiusi come forma ormai obsoleta di pubblicazione della conoscenza. Spesso i dati sono più interessanti delle conclusioni che se ne traggono, perché permettono discussione ed interpretazioni alternative: “chiuderli” esclusivamente dentro PDF e Powerpoint è sicuramente un errore, ed un’altra faccia dello stesso problema. Qui i concetti da cui si può partire per un ragionamento sono: openaccess (aspetto culturale, giuridico, economico, professionale) opensource (aspetto informatico, produzione) open standards (accesso, riuso, riconfigurazione).
PMR: Good accurate report, like the others. I am interested to see that Italian uses many English terms directly “copyright”, “repository”, “open access”, “text mining”. I don’t want to seem like an anglophone imperialist, but in the Internet age it can be useful to know that we are using the same terms for the same concept. Of course copyright will be country-dependent in precise meaning.
Pingback: Le sorprese, le reti e questo blog « ServiziBibliograficiDigitali