Über 14 Millionen gescannte Buchseiten erscheinen online Automatische übersetzen
Millionen gescannter Seiten mit Büchern erschienen auf der Flickr-Ressource, die die amerikanische Organisation Internet Archive kostenlos zur Verfügung stellte. Gegenwärtig wurden bereits etwa 3 Millionen Bilder veröffentlicht, und dies ist nur der Anfang, so die Organisatoren des Projekts, dass in naher Zukunft mehr als 14 Millionen Seiten gescannten Texts kostenlos verwendet werden.
Die Umsetzung eines solchen Großprojekts wurde nur dank des kürzlich erstellten Algorithmus ermöglicht, der automatisch Bilder aus mehr als 2 Millionen Büchern extrahiert, die derzeit in der öffentlichen Bibliothek der Organisation Internet Archive gespeichert sind. Dieses von Kalev Litaru, einem Forscher an der Georgetown University, entwickelte Programm erkennt automatisch Text und extrahiert 500 Wörter aus jedem gescannten Bild, wodurch die Textsuche in der Sammlung ermöglicht wird.
Es ist bemerkenswert, dass alle Bilder von Texten, die im Auftrag von Internet Archive veröffentlicht wurden, nicht urheberrechtlich geschützt sind, so dass sie kostenlos im Internet verbreitet werden können. Die Projektersteller glauben, dass sie im Laufe der Zeit eine visuelle Bibliothek erstellen können, in der Informationen durch Lesen von Bildern gesucht werden.
Bisher ist die Organisation Internet Archive Book Images in das allgemeine Projekt The Commons eingebunden, dessen Ziel es ist, offene Bibliotheken zu schaffen, um das Erbe des Internets zu bewahren. Der Dienst hat bereits spezielle Unterkategorien für Audio-, Video- und Grafikmaterialien, veraltete Versionen von Websites, Konsolenspiele der 1970er und 80er Jahre sowie alle Arten von Software. Die im Internetarchiv gespeicherten Informationen sind bereits 19 Pb groß und umfassen mehr als 600 Millionen gescannte Texte von Büchern verschiedener Genres und Richtungen, die in den letzten 500 Jahren geschrieben wurden.
Svetlana Korableva © Gallerix.ru
- „Utilitarismus“ von John Stuart Mill
- "Die Ursprünge des Totalitarismus" von Hannah Arendt, Zusammenfassung
- Tatsächliche Erfahrung im Kampf gegen den Totalitarismus
- Totalitäre Tendenzen in der Architektur der 20-30er Jahre
- Banksy: Vandalismus oder Kunst?
- In Moskau die Eröffnung des bibliothekarischen Zentrums des Schriftstellers Fazil Iskander
Adblock bitte ausschalten!
Sie können nicht kommentieren Warum?