Внимание! При экспорте из FineReader 11 в fb2 возможно потеря текста!!!!
Опубликовано ср, 23/05/2012 - 00:23 пользователем Belomor.canal
Forums: Привет всем! 3 апреля. Суббота ФР -11 интерпретировал как СНОСКУ! При экспорте в fb2, все сноски, которые ФР-11 не знает куда отнести в итоговый текст не попадают! В данном случае текст этой записи пропал! Смена стиля ничего не дала!
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Aliki RE:Подайте бедному копеечку на книжку с литреса... 3 часа
Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 3 дня sem14 RE:Современная корейская литература. Книжная серия... 6 дней sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 6 дней kopak RE:На 78-м году жизни скончался советский и российский... 2 недели Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 недели Саша из Киева RE:Подводное течение 2 недели lemma7 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 2 недели konst1 RE:Переименовать ник (имя учетки) 3 недели Larisa_F RE:Таррин Фишер 1 месяц Aleks_Sim RE:Беженцы с Флибусты 1 месяц Саша из Киева RE:Как приобретать друзей и оказывать влияние на людей 1 месяц Isais RE:Семейственность в литературе 1 месяц miri.ness_ RE:Доступ 27 1 месяц bmusanov Оплатил, но абонемент не отображается 1 месяц holla RE:Багрепорт - 2 1 месяц konst1 RE:Файнридер для Win11 1 месяц larin RE:Оплатил, но абонемент не отображается 1 месяц Впечатления о книгах
obivatel про Номен: Олегархат им. тов. Сталина (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
24 09 Немного более сильно напрягает использование автором оборотов со словом "более". Если таким образом перефразировать т.Сталина, получится нечто типа "Жить стало более хорошо, жить стало более радостно". Надо полагать, автор ……… Оценка: неплохо
Никос Костакис про Конторович: За Державу обидно! [litres] (Альтернативная история, Боевая фантастика)
22 09 – Куда б ему деваться-то? Стонал, что твой Плюшкин! Гость вопросительно приподнял бровь. – Есть у нас такой литературный персонаж – патологически жадный и неопрятный тип, ростовщик! ___________________________________ Плюшкин - ростовщик??? Я впечатлен!
Barbud про Горнов: Ульян едет в Крым (Социальная фантастика)
22 09 Ерунда какая-то несусветная, ни о чем вообще. Начал читать, одолел чуток, честно пытаясь вчитаться - вообще не понял, зачем и о чем оно написано. Проскроллил дальше - там не лучше. Ниасилил, в общем. Оценка: нечитаемо
mysevra про Ночкин: Череп мутанта (Боевая фантастика)
22 09 О, эта часть более динамична, чем первая. И обложка красивая. Оценка: хорошо
mysevra про Подшибякин: Голодный мир [litres] (Ужасы, Мистика)
22 09 Во-первых, надоел мат, просто утомил, это уже не оригинально. Во-вторых, если вдуматься и представить себе всё это, то да, жутко, но персонажи такие отвратные, что как бы ждешь, чтобы их поскорее перемололо. И впечатление ……… Оценка: неплохо
mysevra про Нин: Генри и Джун (Эротика)
22 09 Жить в праздности, не заботиться ни о чём, кроме как о «раскрепощении и освобождении чувственности» - это так мило и восхитительно, что злит неимоверно. Злит даже не то, чем забита голова главной героини в то время, как другие ……… Оценка: плохо
obivatel про Номен: Внучь олегарха (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
21 09 Мне очень понравилось. Почитал комментарии и лишний раз убедился, что на вкус и цвет фломастеры разные. . И я к пятой главе понял, что за телеграмма пошла вначале сюжета. Хороший дедулька у бабушки был; жаль, что в ……… Оценка: отлично!
obivatel про Гросов: Инженер Петра Великого – 2 (Альтернативная история, Исторические приключения, Попаданцы, Самиздат, сетевая литература)
20 09 В общем, устал я читать этот бред. Автор не понимает простейших вещей и у меня большие сомнения, что он инженер: слишком много пробелов в знаниях. Эх, а ведь там аж куча томов, читать-не-перечитать. Но не для меня эта ягодка... волчья. Оценка: нечитаемо
obivatel про Гросов: Инженер Петра Великого – 1 (Альтернативная история, Исторические приключения, Попаданцы, Самиздат, сетевая литература)
19 09 Пока автор писал про плавку, про станки и инструмент, всё было гут. Но зачем он начал писать про военку, если ВООБЩЕ ничего не понимает? Проблема стрельбы круглым объектом из гладкоствола в неконтролируемом вращении снаряда ……… Оценка: плохо
obivatel про Жизнь Лекаря с нуля
18 09 Написано хорошим слогом, читать приятно. . Много логических противоречий, которые цепляют и раздражают; -- некоторые противоречия необходимы для "логики мира", но она от этого сильно прихрамывает; -- некоторые, ………
alexk про Шпаковский: Читающее Средневековье [litres] (Исторические приключения, История)
17 09 С картинками какая-то беда. То не те, то не там, то дубли...
Думает про Крашенинников: Наследники или ренегаты. Государство и право «оттепели» 1953-1964 [litres] (Политика, Юриспруденция)
17 09 Все романтики сгорели в сталинских лагерях. А те, что смогли оттуда выйти после войны - уже не были романтиками. Показателен в этом смысле кейс человека и его семьи, который укрывал Ленина в Финляндии (знаменитый шалаш в ……… |
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Изменить размер шрифта стиля "Сноска" и "Оглавление" на ЗНАЧИТЕЛЬНО отличающийся от основного текста и проглядывать при распознании в FineReader. Найденный кусок вырезать, копировать в блокнот и возвращать копированием из блокнота.
Тема обсуждалась Голмой около двух месяцев назад, ссылку найти не могу.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Desenchantee]Тема обсуждалась Голмой около двух месяцев назад, ссылку найти не могу.
Спасибо! Значит тема закрыта
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Сноска http://lib.rus.ec/node/367351
Но там о том что часть нормальный текст вдруг может быть распознан как сноска нет!
Так что какой то смысл в моём сообщение есть :-)
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Сноска http://lib.rus.ec/node/367351
Но там о том что часть нормальный текст вдруг может быть распознан как сноска нет!
Так что какой то смысл в моём сообщение есть :-)
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Там нет. Есть ниже. Я говорил, что FR11 может счесть сноской текст до половины страницы - всё, лежащее ниже пустой строки или отбивки * * *.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Isais]Там нет. Есть ниже. Я говорил, что FR11 может счесть сноской текст до половины страницы
Спасибо! Именно так! Ну что ж, известно кто учится на своих, а не на чужих ошибках! В общем я пока буду в ворд- там просто смотришь в конец файла и все сразу понятно!! Скачал последний билд, но вряд это это поправио!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Совершенно верно. :)
Сейчас, перед тем, как работать с текстом в ФР, я проделываю следующие операции:
- объединяю все стили сносок в один (если их всего два, то смысле объединять нет - как правило, один из них с курсивом, который при объединении может потеряться) и придаю им размер шрифта 6-7.
- каждому стилю "основной текст" придаю размер шрифта 10 (их не объединяю, поскольку при этом теряется форматирование курсивом и полужирным)
- все стили колонтитула объединяю и придаю им размер шрифта 6-7
- все стили заголовка объединяю и придаю им размер шрифта 20-26
- все стили оглавления объединяю и придаю им размер шрифта 30, курсивность и жирность.
Нажимаю "ОК" и жду, пока ФР объединит все шрифты.
Такой способ позволяет на 100% выявить неверный стиль при распознавании. В том числе, ту его часть, которая внизу страницы была распознана как сноска, - по размеру шрифта.
Метод борьбы с этими ошибками был уже описан Desenchantee. :)
Что касается самостоятельной расстановки сносок силами самого ФР, то качество этой версии хоть и намного лучше, но всё равно 100%-ной гарантии правильной расстановки нет.
Поэтому я предпочитаю пользоваться старинным методом: переношу текст сноски к слову, к которому она относится, заключая его в фигурные скобки. В ФБЕ потом эти сноски расставляются одним кликом.
В документальной литературе, где сносок очень много, сноски так не расставляю. Но после экспорта в фб2 методично - страница за страницей - проверяю сноски на наличие в боди "Примечание". Недостающие добавляю. Да, часто их текст оказывается после всего текста, но не менее часто он просто отсутствует.
При количестве сносок более 200 - этот способ всё равно более рациональный, на мой взгляд.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote golma1]Сейчас, перед тем, как работать с текстом в ФР, я проделываю следующие операции:
- объединяю все стили сносок в один (если их всего два, то смысле объединять нет - как правило, один из них с курсивом, который при объединении может потеряться) и придаю им размер шрифта 6-7.
- каждому стилю "основной текст" придаю размер шрифта 10 (их не объединяю, поскольку при этом теряется форматирование курсивом и полужирным)
- все стили колонтитула объединяю и придаю им размер шрифта 6-7
- все стили заголовка объединяю и придаю им размер шрифта 20-26
- все стили оглавления объединяю и придаю им размер шрифта 30, курсивность и жирность.
Нажимаю "ОК" и жду, пока ФР объединит все шрифты.
Такой способ позволяет на 100% выявить неверный стиль при распознавании. В том числе, ту его часть, которая внизу страницы была распознана как сноска, - по размеру шрифта.
Отличный способ с гарантией!!!!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Небольшое техническое дополнение - мне так удобнее. После объединения, находите первую сноску, нажимете кнопку стили, далее OK и сноска окрасится зелёным цветом. Далее листа страниы (Alt+стрелка) вы видите зелёные куски текста - это и есть область СНОСКИ!!! Так очень быстро можно посмотреть весь проект! Ярко зелёная область просто бросается в глаза!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Кстати говорят есть новый билд. Кто ни будь на нём пробовал? У меня 11.102.481 прошлогодний
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
11.0.102.583 - те же ошибки. Обещали исправить в 12, но когда он будет...
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Desenchantee]11.0.102.583 - те же ошибки. Обещали исправить в 12, но когда он будет...
Спасибо что предупредили! Скачал из торрентов собирался ставить. Мой совет ребятам из Фр - сделайте опцию "различать" и "не различать"! После таких шуток, когда полстраницы обычного текста превращается в сноску, лучше без! И конечно хорошо бы, что бы экспорт из ФР был управляемый - если я сделал стиль сноска то это и есть сноска!