Jag läste Robot Librarians övningar i att använda Solr för Hathi Trust data och blev åter intresserad av att göra något själv med tjänsten.
Hathi trust är ett gemensamt arkiv för digitaliserade bibliotekssamlingar.
Man kan söka i arkivet och man kan bläddra i böckerna. Allt är väldigt fint. Men vad som är ännu finare är att det finns metoder för att komma åt datat och därmed bädda in i lokala tjänster. Ett exempel på det är University of Chicago. Extra spännande är det att man kan ladda ned data och indexera lokalt om man vill.
Aktuella siffror från deras webbplats:
Currently Digitized
- 4,142,499 volumes
- 1,449,874,650 pages
- 154 terabytes
- 49 miles
- 3,366 tons
- 672,631 volumes (~16% of total) in the public domain
Hathi Trust erbjuder mängder med digitaliserat material som är i public domain. Detta skulle man kan kunna göra något av. Jag är tveksam till att allt Hathi Trust data (eller ens allt som finns i PD) skulle passa in i JULIA. Eller att vi skulle få speciellt många matchningar om vi gjorde som University of Chicago. Jag skall göra lite stickprov för att se.
Men för de stora universitetsbiblioteken med sina stora samlingar, eller för den delen LIBRIS, så borde detta vara av mycket stort intresse.