Existe una base de datos desarrollada por expertos de la Universidad de Harvard y del Instituto Tecnológico de Massachusetts, en coordinación con Google Books, American Heritage Dictionary y la Enciclopedia Británica que reúne aproximadamente 4% de todos los libros impresos en el Mundo. El propósito de este proyecto es de crear una especie de mapa del genoma cultural y a partir de él se puedan realizar análisis cuantitativos que expresen las tendencias sociales y la memoria histórica que han existido desde que se inventó el libro impreso.
Para ello, Culturomics contabilizó la frecuencia con que las palabras aparecen en los libros a través del tiempo, así es posible conocer las veces que una palabra ha sido utilizada, las variaciones que ha sufrido, si ha sido censurada o que tanta propaganda se le ha dado. Hasta el momento la base da datos cuenta alrededor de 5.2 millones de libros, con más de 500 mil millones de palabras, y aunque más del 70% del texto de encuentra en Inglés, existe también en Español, Alemán, Francés, Ruso y Chino