Rambler's Top100
Портал | Содержание | О нас | Пишите | Новости | Книжная лавка | Голосование | Топ-лист | Регистрация | Дискуссия
Лучшие молодые
ученые России

Авторские научные обозрения в "Русском переплете"
"Физические явления на небесах" | "Неизбежность странного микромира" | "Биология и жизнь" | "Terra & Comp" | Научно-популярное ревю | Теорфизика для малышей
Семинары - Конференции - Симпозиумы - Конкурсы

TERRA & Comp
С 07 августа 2003 года обозрение ведет Александр Семенов
До 10.07.2002 вел Кирилл Крылов

НАУКА

Новости

Научный форум

Научно-популярный журнал Урания в русском переплете

Космические новости

Энциклопедия космонавтика

Энциклопедия "Естествознание"

Журнальный зал

Физматлит

News of Russian Science and Technology

Научные семинары

Почему молчит Вселенная?

Парниковая катастрофа

Кто перым провел клонирование?

Хронология и парахронология

История и астрономия

Альмагест

Наука и культура

 Журналы в сети:

Nature

Успехи физических наук

New Scientist

ScienceDaily

Discovery

ОБРАЗОВАНИЕ

Открытое письмо министру образования

Антиреформа

Соросовский образовательный журнал

Биология

Науки о Земле

Математика и Механика

Технология

Физика

Химия

Русская литература

Научная лаборатория школьников

КОНКУРСЫ

Лучшие молодые
ученые России

Для молодых биологов

БИБЛИОТЕКИ

Библиотека Хроноса

Научпоп

РАДИО

Читают и поют авторы РП

ОТДЫХ

Музеи

Игры

Песни русского застолья

Народное

Смешное

О НАС

Редколлегия

Авторам

О журнале

Как читать журнал

Пишут о нас

Тираж

РЕСУРСЫ

Поиск

Проекты

Посещаемость

Журналы

Русские писатели и поэты

Избранное

Библиотеки

Фотоархив

ИНТЕРНЕТ

Топ-лист "Русского переплета"

Баннерная сеть

Наши баннеры

НОВОСТИ

Все

Новости русской культуры

Новости науки

Космические новости

Афиша

The best of Russian Science and Technology


"Русский переплет" зарегистрирован как СМИ. Свидетельство о регистрации в Министерстве печати РФ: Эл. #77-4362 от
5 февраля 2001 года. При полном или частичном использовании
материалов ссылка на www.pereplet.ru обязательна.

Тип запроса: "И" "Или"

29.08.2010
19:54

Число людей, пользующихся Интернетом во время просмотра ТВ, возрастает

    Стала известна довольно интересная статистика. Оказывается, число людей, которые пользуются Интернетом во время просмотра телепередач, возрастает. Новое . . .

29.08.2010
18:13

Новый источник энергии - воздух

    Как пишет сайт 3dnews.ru, благодаря открытию бразильских ученых из Университета города Кампинас в недалеком будущем могут появиться устройства, вырабатывающие . . .

28.08.2010
23:36

Российские ученые обнаружили в космосе новын объекты

    Учёные из Института космических исследований Российской Академии Наук применили новые методы анализа изображений различных областей Вселенной, полученных в . . .

28.08.2010
23:14

Биологи расшифровали геном муравья

    Биологи выяснили, какие гены делают муравьиную царицу царицей и как они распределяют по кастам ее подданных. А также поняли, почему царица живет в пятьсот раз . . .

28.08.2010
23:09

Биочип позволяет установить личность человека

    Специалисты Института молекулярной биологии им. В. А. Энгельгардта РАН и Московского физико-технического института (государственного университета) разработали . . .

28.08.2010
23:07

Интернет-серфинг ухудшает работу мозга

    Интенсивное и продолжительное пользование интернетом ведет к изменениям в работе головного мозга человека, который теряет способность к системному и . . .

27.08.2010
19:04

Вижу атом!

    Ирина Якутенко пишет на сайте Lenta.ru, что ученые научились рассматривать в микроскоп отдельные атомы Наверное, все читатели помнят уроки биологии в школе, на . . .

27.08.2010
19:00

Бюджет CERN сократили на четверть миллиарда долларов

    Бюджет Европейского центра ядерных исследований (CERN) - организации, курирующей работу Большого адронного коллайдера, в период с 2011 по 2015 годы будет урезан на 250 . . .

27.08.2010
17:19

50% потребителей смотрят ТВ в Интернете

    Подразделение ConsumerLab компании <Эрикссон> опубликовало результаты недавнего исследования <Потребление мультимедиа-услуг на разных устройствах - 2010>. Оказалось, . . .

27.08.2010
17:16

Intel: Обама разрушает американскую технологическую индустрию

    Гендиректор Intel Пол Отеллини считает, что при Бараке Обаме американское правительство стало открыто враждебно к бизнесу. Если ничего не предпринять, <следующий . . .

27.08.2010
16:50

Видеотехнологии Cisco для российских акушеров

    Специалисты технологической группы Cisco TelePresence совместно с компанией I.S.P.A.-Engineering завершили проект по организации видеоконференцсвязи для ФГУ <Научный центр . . .

27.08.2010
16:46

Черные дыры управляют ростом галактик

    Астрономы из Швейцарии и США с помощью суперкомпьютера рассчитали, как вскоре после рождения Вселенной могли формироваться сверхмассивные черные дыры, которые . . .

27.08.2010
16:42

Химики создали "сухую" воду

    "Сухую воду", представляющую собой микроскопические капли воды в кремниевой оболочке, создали британские химики совместно с китайскими коллегами. Разработку в . . .

27.08.2010
16:29

Европе грозит малый ледниковый период

    Европе грозит новый малый ледниковый период, аналогичный тому, что просуществовал на Старом континенте с 1650 по 1700 годы. К такому выводу пришла научная группа . . .

27.08.2010
16:17

Телескоп "Кеплер" впервые взвесил две экзопланеты

    Астрономы, работающие с данными телескопа "Кеплер", впервые сумели оценить массы планет, опираясь только на переданную телескопом информацию. Статья . . .

27.08.2010
16:15

Ученые расшифровале геном пшеницы

    Британские ученые опубликовали черновой вариант расшифровки генома пшеницы - одного из самых важных сельскохозяйственных злаков. Полученные генетические данные . . .

27.08.2010
16:14

Растения научились звать на помощь хищных насекомых

    Растения, поедаемые гусеницами, могут "призывать на помощь" хищных насекомых, которые питаются гусеницами. Такие выводы представлены в статье ученых из Германии и . . .

27.08.2010
14:32

Как подключить телевизор к компьютеру?

    Компьютеры давно стали настолько производительными, что превратились из рабочего инструмента в современный центр досуга. Сегодня многие покупают компьютер не . . .

27.08.2010
14:00

IBM и Евросоюз сотрудничают в проекте по созданию технологии для крупномасштабной оцифровки европейских исторических текстов

    Корпорация IBM и Европейский Союз расширили свое исследовательское партнерство, в котором теперь участвуют около тридцати национальных библиотек, научно-исследовательских институтов, университетов и организаций со всей Европы. Цель этого расширенного партнерства - создать новую технологию, которая позволит с высокой точностью и на массовой основе преобразовывать в цифровую форму исторически и культурно значимые текстовые материалы. В отличие от предыдущих проектов по оцифровке текстов, результаты которых оказались статичными и не получили дальнейшего развития, эта уникальная крупномасштабная инициатива, получившая название IMPACT (IMProving ACcess to Text; <улучшение доступа к тестам>), предложит европейским институтам новые инструменты и наилучшие методики, которые дадут им возможность эффективно продолжать создание высококачественных цифровых копий редких исторических текстов, размещая их в Интернете и делая широко доступными для поиска и онлайнового редактирования.

    Исследовательский проект IMPACT, финансируемый Евросоюзом, сочетает в себе возможности нового инновационного Web-ориентированного программного обеспечения для адаптивного оптического распознавания символов (OCR) с мощью технологии "crowd computing" - быстроразвивающейся концепции, основанной на совместном использовании коллективных знаний, навыков и опыта многочисленных групп людей (или <толп> людей) для расширения, углубления и совершенствования процесса или продукта с целью коренного улучшения его качества и эффективности. Объединение этих технологий позволит заинтересованным сторонам впервые адаптировать процедуры оцифровки и распознавания текста к особенностям древних шрифтов, к искажениям и аномалиям, и даже к специфическим терминологиям и лексиконам - при сокращении показателей частоты появления ошибок на 35% и частоты замещений и подстановок символов и сочетаний символов на 75%.

    .

    OCR-технологии сегодня прекрасно справляются с современными печатными текстами, однако старые выцветшие чернила и типографская краска, необычная форма древних шрифтов способны снизить показатели распознавания текста до 50%, что потребует большого объема последующих ручных операций вычитки и правки. Следовательно, для крупномасштабных проектов подобно этому, эффективность последующей обработки оцифрованного текста является критически важным условием. <Единственным путем осуществления крупномасштабного проекта по преобразованию текстов в цифровую форму является коренное улучшение качества первоначального оптического распознавания текста и максимально возможное сокращение последующей ручной обработки, - подчеркнула Хильделиз Балк (Hildelies Balk), руководитель отдела европейских проектов Национальной библиотеки Нидерландов (Koninklijke Bibliotheek) и координатор проекта IMPACT. - С помощью IMPACT мы надеемся достичь значимого улучшения продуктивности процесса оцифровки текстов>.

    В основе проекта оцифровки лежит уникальная система коллективной корректуры, разработанная исследователями IBM, которая через интерактивный Web-интерфейс облегчает большим группам добровольцев-корректоров со всего континента проверку правильности обработки текста и исправление ошибок оптического распознавания. Кроме того, система обладает способностью <обучаться> на обнаруженных OCR-ошибках и автоматически адаптироваться к специфике шрифтов.

    Технология IMPACT оптимизирует, упрощает и ускоряет процесс исследования отсканированного текста и отбора спорных (сомнительных) участков, предоставляя корректорам возможность эффективно править текст. Вместо отображения полного текста оцифрованной страницы корректоры видят только буквы или слова, помеченные как спорные. Например, комбинация букв "r" и "n" ("rn") может быть неотличима от буквы "m". В подобных случаях система отбирает многие встречающиеся в тесте варианты использования буквы "m" и размещает эти примеры рядом со <спорными> буквами. Данная методика существенно облегчает правильное определение букв в словах текста.

    В случаях, когда неочевидным является целое слово, оно добавляется в специальный словарь спорных выражений, которые отсортировываются в алфавитном порядке. Добровольным корректорам нужно лишь <одним щелчком мыши> принять или отвергнуть предлагаемые замены-подставновки. Кроме того, система использует метод адаптивного расширения словаря, когда новые слова добавляются в основной словарь на основе кросс-идентификации и правки другими пользователями.

    Так, например, текст небольшой книжки, который <набивается> вручную на компьютере, в среднем, за четыре часа, можно оцифровать с помощью стандартной OCR-технологии и вручную откорректировать за час. Внедрение новой технологии коллективной корректуры сокращает этот процесс до 30 минут. Исследователи IBM отмечают, что новая адаптивная система оптического распознавания текста может дополнительно снизить это время еще на 15 минут.

    Исследователи IBM Research из Хайфы обладают опытом разработки уникальных методик OCR, эффективность которых подтверждена годами использования - от инструментов, помогающих отслеживать, классифицировать и категоризировать сообщения и пакеты крупных почтовых служб, до решений по оптимизации считывания символов на номерных знаках автомобилей в системах дорожных сборов как меры борьбы с транспортными перегрузками в крупных городах (congestion pricing). IMPACT, вероятно, является первой реальной попыткой разработать адаптивный механизм оптического распознавания текста, специально предназначенный для создания массовых цифровых библиотек.

    О консорциуме IMPACT

    В консорциум партнеров проекта IMPACT входят, среди прочих, следующие организации: исследовательский центр IBM в Хайфе, Израиль (IBM Research - Haifa); Национальная библиотека Нидерландов (Koninklijke Bibliotheek); Британская библиотека (British Library); Австрийская национальная библиотека (Österreichische Nationalbibliothek); Университет города Инсбрук, Австрия (Universität Innsbruck); Немецкая национальная библиотека (Deutsche Nationalbibliothek); Баварская государственная библиотека (Bayerische Staatsbibliothek); Государственная и университетская библиотека города Геттинген (Staats- und Universitätsbibliothek Göttingen), Германия; компания ABBYY Production; Институт лексикологии в Лейдене (Instituut voor Nederlandse Lexicologie), Нидерланды; Национальный научно-исследовательский центр "Demokritos" (National Centre for Scientific Research "Demokritos") в Афинах, Греция; Центр информационной и языковой обработки текста (Centrum für Informations- und Sprachverarbeitung) при Мюнхенском университете (University of Munich), Германия; Университет города Бат (University of Bath), Великобритания; Университет города Солфорд (University of Salford), Великобритания; Национальная Библиотека Франции (Bibliothèque Nationale de France); Национальная библиотека Испании (Biblioteca Nacional de España); и Центр высокопроизводительных вычислений и сетей города Познань (Poznan Supercomputing and Networking Center), Польша.

    Более подробную информацию об исследовательском подразделении IBM Research можно получить на Web-сайте www.research.ibm.com

    Информация о консорциуме IMPACT приводится на Web-сайте http://www.impact-project.eu/

27.08.2010
13:41

Итоги 11-й летней школы Intel

    Корпорация Intel подвела итоги 11-го витка академической программы <Летняя школа Intel>, в рамках которой 65 студентов, магистров и аспирантов из вузов России прошли . . .

<< 1891|1892|1893|1894|1895|1896|1897|1898|1899|1900 >>

ЛИТЕРАТУРА

Новости русской культуры

К читателю

Содержание

Публицистика

"Курск"

Кавказ

Балканы

Проза

Поэзия

Драматургия

Искания и размышления

Критика

Сомнения и споры

Новые книги

У нас в гостях

Издательство

Книжная лавка

Журнальный зал

ОБОЗРЕНИЯ

"Классики и современники"

"Слово о..."

"Тайная история творений"

"Книга писем"

"Кошачий ящик"

"Золотые прииски"

"Сердитые стрелы"

КУЛЬТУРА

Афиша

Новые передвижники

Фотогалерея

Музыка

"Неизвестные" музеи

Риторика

Русские храмы и монастыри

Видеоархив

ФИЛОСОФИЯ

Современная русская мысль

Искания и размышления

ИСТОРИЯ

ХРОНОС

История России

История в МГУ

Слово о полку Игореве

Хронология и парахронология

Астрономия и Хронология

Альмагест

Запечатленная Россия

Сталиниана

ФОРУМЫ

Дискуссионный клуб

Научный форум

Форум "Русская идея"

Форум "Курск"

Исторический форум

Детский форум

КЛУБЫ

Пятничные вечера

Клуб любителей творчества Достоевского

Клуб любителей творчества Гайто Газданова

Энциклопедия Андрея Платонова

Мастерская перевода

КОНКУРСЫ

За вклад в русскую культуру публикациями в Интернете

Литературный конкурс

Читательский конкурс

Илья-Премия

ДЕТЯМ

Электронные пампасы

Фантастика

Форум

АРХИВ

2001

2000

1999

Фотоархив

Все фотоматериалы

Помощь корреспонденту Добавить новость
НАУКА В "РУССКОМ ПЕРЕПЛЕТЕ"

Если Вы хотите стать нашим корреспондентом напишите lipunov@sai.msu.ru

 

© 1999, 2000 "Русский переплет"
Дизайн - Алексей Комаров

Rambler's Top100