12 млн історичних зображень викладають онлайн. СКАНИ

Доцент Джорджтаунського університету (США) Калев Літару створив пошукову базу з 12 млн історичних зображень, на які не поширюється авторське право.

29 серпня 2014

Про це повідомляє BBC.

Науковець уже завантажив 2,6 млн фотографій на популярний інтернет-сервіс обміну фотографіями Flickr, решту викладуть протягом кількох місяців.

Фотографії та малюнки взяті з понад 600 мільйонів сторінок бібліотечних видань, відсканованих некомерційною організацією "Архів інтернету".

Досі отримати доступ до цих зображень було дуже складно.

"Роками всі бібліотеки оцифровували свої книги, але конвертували їх у PDF-файли або текстові документи, - зазначив Літару. - Вони зосередилися на книгах як на наборі слів. Цей проект змінює такий підхід".

Англійська служба BBC зазначає, що одним із результатів проекту стало зростання кількості зображень котів у мережі :)

За словами науковця, більшості ілюстрацій, розміщених у старих виданнях, немає у жодній художній галереї світу, а їхні оригінали давно втрачені.

Цей малюнок, датований 1502 роком, є одним із найдавніших в колекції. Ілюстрація з іспанського видання "Трагікомедія Калісто і Мелібеї"

Зображення датуються від 1500 до 1922 року - період, на який не поширюються обмеження у зв'язку з авторським правом. Фактично від початку книгодрукування [першим друкованим виданням у Західному світі вважається "Біблія" Гутенберга 1452 року].

Є ілюстрації ще давніші. Оця мальована інструкція з полювання на зайця - картинка до французької "Книги про лови" 1486 року видання. Копія ілюстрації опинилася в каталозі бібліотеки родини Спенсерів, виданому в 1822-му, звідти потрапила в бібліотечні скани, зі сканів - у інтернет

Програміст Літару почав роботу над проектом, досліджуючи комунікаційні технології в Джорджтаунському університеті у Вашингтоні, в рамках гранту від компанії Yahoo (власник сервісу Flickr).

Програма, яка сканує друковані видання для "Архіву інтернету", вміє визначати наявність на сторінках ілюстрацій - щоб "вирізати" їх із чистового файлу, залишивши тільки "оптично розпізнаний" текст. Цю функцію Літару використав для створення нової програми, яка працює з оригіналами бібліотечних сканів, знаходить вирізані фрагменти і зберігає кожен окремим файлом у звичному для більшості користувачів форматі .jpg.

Реклама з газети The Saturday Evening Post, грудень 1920 року. The Dictaphone - машина для запису людського голосу на воскові циліндри, перший диктофон у світі. Текстова частина реклами розповідає, як ділові люди завдяки пристрою економлять на поштових витратах і витратах на персонал

Програма також копіює фрагменти тексту до і після ілюстрації, після чого виводить ілюстрацію і тексти до неї окремим постом у Flickr.

В результаті користувачі отримали доступ до величезного каталогу друкованих ілюстрацій за останні 500 років. Орієнтуватися в ньому можна завдяки доданим тегам (через автоматизацію процесу не завжди точним) і за допомогою стандартного пошукового інструментарію фотосервісу.

Інтернет-адреса проекту на Flickr - Internet Archive Book Images.

Такий вигляд має сторінка проекту

Також Літару зазначив, що цікаво спостерігати, як протягом років і сторіч змінювалися зображення речей.

"Наберіть у пошук, приміром, слово "телефон", і ви побачите, що всі картинки - це зображення бізнесменів, переважно чоловіків... - навів приклад науковець. - Потім ви бачите, як телефон перетворюється на пристрій, що з'єднує сім'ї".

XIX сторіччя, телефон з'єднує міста США

Зображення можуть бути корисними науковцям-аматорам і професійним історикам. Також в один клік можна перейти на оригінальні скани сторінок, є інформація по джерелу кожної ілюстрації.

Світанок автомобілізму. До речі, дивіться фото автомобілів і їхніх власників в Одесі, 1911 рік

За словами Літару, наступного року він планує пов'язати архів із найпопулярнішою інтернет-енциклопедією - Вікіпедією. Науковець вважає, що ілюстрації зробили би значно цікавішими статті з Вікі на історичну тематику.

Також: "Британська бібліотека оцифровує класичну літературу. СКАНИ"

Теми

Дивіться також

Посольство Китаю з нагоди Року Тигра запрошує на онлайн-виставку про Теракотову армію

Україномовній Вікіпедії виповнилося 18 років

АНОНС: презентація нового онлайн-ресурсу ЦДАВО

«Україна», «Шевченко» і «Київ» стали найпопулярнішими статтями української Wikipedia у 2021 році

Хакери обґрунтували атаку на сайти Кабміну та міністерств історичною помстою

12 млн історичних зображень викладають онлайн. СКАНИ

Доцент Джорджтаунського університету (США) Калев Літару створив пошукову базу з 12 млн історичних зображень, на які не поширюється авторське право.

Година папуги. «Золотий вересень»

Чому «Пушкіни» в публічному просторі - це ворожа російська пропаганда

Не товариш. Фантастичні вибори великого 1990 року

Степан Скрипник. Хорунжий Армії УНР, депутат, патріарх

Музею Голодомору передали особисту бібліотеку дипломата Володимира Василенка

В Ізраїлі встановили перший пам'ятник жертвам Голодомору

У Львові реставрують сходи з музею Шухевича, які вціліли після російської атаки

Служба зовнішньої розвідки України повернула історичний стародрук XVIII століття