12 млн історичних зображень викладають онлайн. СКАНИ
Доцент Джорджтаунського університету (США) Калев Літару створив пошукову базу з 12 млн історичних зображень, на які не поширюється авторське право.
Про це повідомляє BBC.
Науковець уже завантажив 2,6 млн фотографій на популярний інтернет-сервіс обміну фотографіями Flickr, решту викладуть протягом кількох місяців.
Фотографії та малюнки взяті з понад 600 мільйонів сторінок бібліотечних видань, відсканованих некомерційною організацією "Архів інтернету".
Досі отримати доступ до цих зображень було дуже складно.
"Роками всі бібліотеки оцифровували свої книги, але конвертували їх у PDF-файли або текстові документи, - зазначив Літару. - Вони зосередилися на книгах як на наборі слів. Цей проект змінює такий підхід".
Англійська служба BBC зазначає, що одним із результатів проекту стало зростання кількості зображень котів у мережі :) |
За словами науковця, більшості ілюстрацій, розміщених у старих виданнях, немає у жодній художній галереї світу, а їхні оригінали давно втрачені.
Цей малюнок, датований 1502 роком, є одним із найдавніших в колекції. Ілюстрація з іспанського видання "Трагікомедія Калісто і Мелібеї" |
Зображення датуються від 1500 до 1922 року - період, на який не поширюються обмеження у зв'язку з авторським правом. Фактично від початку книгодрукування [першим друкованим виданням у Західному світі вважається "Біблія" Гутенберга 1452 року].
Є ілюстрації ще давніші. Оця мальована інструкція з полювання на зайця - картинка до французької "Книги про лови" 1486 року видання. Копія ілюстрації опинилася в каталозі бібліотеки родини Спенсерів, виданому в 1822-му, звідти потрапила в бібліотечні скани, зі сканів - у інтернет |
Програміст Літару почав роботу над проектом, досліджуючи комунікаційні технології в Джорджтаунському університеті у Вашингтоні, в рамках гранту від компанії Yahoo (власник сервісу Flickr).
Програма, яка сканує друковані видання для "Архіву інтернету", вміє визначати наявність на сторінках ілюстрацій - щоб "вирізати" їх із чистового файлу, залишивши тільки "оптично розпізнаний" текст. Цю функцію Літару використав для створення нової програми, яка працює з оригіналами бібліотечних сканів, знаходить вирізані фрагменти і зберігає кожен окремим файлом у звичному для більшості користувачів форматі .jpg.
Реклама з газети The Saturday Evening Post, грудень 1920 року. The Dictaphone - машина для запису людського голосу на воскові циліндри, перший диктофон у світі. Текстова частина реклами розповідає, як ділові люди завдяки пристрою економлять на поштових витратах і витратах на персонал |
Програма також копіює фрагменти тексту до і після ілюстрації, після чого виводить ілюстрацію і тексти до неї окремим постом у Flickr.
В результаті користувачі отримали доступ до величезного каталогу друкованих ілюстрацій за останні 500 років. Орієнтуватися в ньому можна завдяки доданим тегам (через автоматизацію процесу не завжди точним) і за допомогою стандартного пошукового інструментарію фотосервісу.
Інтернет-адреса проекту на Flickr - Internet Archive Book Images.
Такий вигляд має сторінка проекту |
Також Літару зазначив, що цікаво спостерігати, як протягом років і сторіч змінювалися зображення речей.
"Наберіть у пошук, приміром, слово "телефон", і ви побачите, що всі картинки - це зображення бізнесменів, переважно чоловіків... - навів приклад науковець. - Потім ви бачите, як телефон перетворюється на пристрій, що з'єднує сім'ї".
XIX сторіччя, телефон з'єднує міста США |
Зображення можуть бути корисними науковцям-аматорам і професійним історикам. Також в один клік можна перейти на оригінальні скани сторінок, є інформація по джерелу кожної ілюстрації.
Світанок автомобілізму. До речі, дивіться фото автомобілів і їхніх власників в Одесі, 1911 рік |
За словами Літару, наступного року він планує пов'язати архів із найпопулярнішою інтернет-енциклопедією - Вікіпедією. Науковець вважає, що ілюстрації зробили би значно цікавішими статті з Вікі на історичну тематику.
Також: "Британська бібліотека оцифровує класичну літературу. СКАНИ"