Типовые ошибки в разметке книг

0
Рыжачков Анатолий Александрович10/7/2019

Уровень 1: «Инерции мышления»

Типовая ошибка #1: Быстро получить ответ (дурная школьная привычка к закрытым задачам).

Ошибка допускается еще до начала разметки, когда человек хочет получить простой и быстрый ответ на вопрос, как «‎правильно / не правильно», и искренне верит, что на тестовой разметке одной книги этому можно научиться.  

Типовая ошибка #2: Подмена фактуры описаниями / эмоциями / оценками / допущениями автора.

Характерный пример — человек отмечает фрагмент типа: «Александр Сергеевич Пушкин — великий русский писатель». Почему? «‎Потому что он был неподражаем, великолепен, гениален». Естественно, творческие приемы работы Александра Сергеевича, его стратегические ошибки и тому подобное — игнорируются. Или же автор книги делает допущение: «‎Представим, что все люди идеальны», — на котором базируется вся книга, а неопытный Разметчик — ведётся. 

Типовая ошибка #3: Смешение новизны для Себя и для базы данных.

Часто бывает, что не искушенный в вопросах естественных наук гуманитарий берётся размечать Ивана Петровича Павлова и открывает для себя много нового. Для себя — да, но для  базы данных, для психофизиологов, да  и всего остального мира — точно нет. «Поп-механика».

Типовая ошибка #4: «Недофактура».

С виду любопытное утверждение проскальзывает у автора, но ничем не подкреплено и может быть выдумкой. Короткий пример: «‎...Кстати, это именно он впервые придумал давать скидку за объём...» В таких случаях стоит «‎копать глубже» и искать подтверждение. 

Типовая ошибка #5: Рефлексия.

Разметчик начинает пропускать текст «‎через себя», ставя себя на место героя / в контекст событий, и вкладывает в слабый фрагмент массу личных смыслов... 

Типовая ошибка #6: «Ключевые слова».

По инерции отмечаются все фрагменты где есть ключевые слова, например: «‎Его творческий прием заключался…» После этих слов чаще всего идет пара абзацев «‎воды», приправленных необоснованными эпитетами. 

Иногда Разметчики «‎хитрят» и ищут такие фрагменты в файлах с распознанным текстом. В этом случае на выходе получается так: отмечено много мусора, а хорошие фрагменты упущены.  

Рисунок: Кривая обучения

Уровень 2: «Цитатник»

Типовая ошибка #7: Узкая цель.

Каждая книга попадает в реестр проработанных, чтобы Коллеги не читали её дважды. Соответственно, из книги должны быть выжаты — в буквальном смысле слова — все важные фрагменты.  

Типовая ошибка #8: Энциклопедизм.

Разметчик отмечает статистические данные, цифры, таблицы, игнорируя всё остальное. Причем, некоторые статистики действительно могут пригодиться, но: а) они менее важны, чем примеры / приемы творческих решений; б) эти данные стоит перепроверять, например, когда автор приводит статистику из «‎не родной» области, да еще и без корректной ссылки, вполне возможно, что данные вырваны из контекста или даже придуманы.

Типовая ошибка #9: Цитатник. 

Это поверхностный срез, который представляет определенную ценность, но ценность эта невелика. Из таких данных можно сделать справочник или очередную книгу в стиле: «‎1000 великих высказываний / пословиц / анекдотов», но закономерности из них не выведешь. 

Типовая ошибка #10: Пропуск нерешенных задач / вопросов на развитие. 

При проработке очередного направления / темы очень важны нерешенные задачи, проблемы и вопросы в явном (и неявном) виде. На основании этих вопросов составляются / пополняются списки литературы. В 100% случаев начинающий Разметчик такие вопросы пропускает, если ему не указать на них. 

Типовая ошибка #11: «Поп-фактики» вместо Фактов.

В столице проходило развлекательное кулинарное мероприятие (не дословно — «Едим как классики»). Суть заключалась в том, что из классических произведений и биографической литературы были выдраны рецепты кулинарных блюд, которые и предлагались счастливым посетителям мероприятия. Из всяких забавных мелочей в стиле «‎как бухали древние греки?» можно делать PR-ивенты, но факт того, что Оскар Уайльд любил сэндвичи с огурцом, не дает ответа на вопрос, как он писал свои произведения. Кстати, и потребление этих сэндвичей не делает из обычных людей значимых писателей...

Типовая ошибка #12: «Хоть что-нибудь», или страх упустить что-то ВАЖНОЕ... 

В начале работы для Разметчиков неочевидна мысль, что есть книги откровенно халтурные, в которых фактуры просто нет. Более того — таких книг большинство. И начинающий, руководствуясь мыслью «‎что-то же должно быть», начинает отмечать разнообразный мусор...

Уровень 3: «Фактура»

Типовая ошибка #13: Пропуск системы / закономерности. 

Фактура бывает «‎сложносоставной»: то есть когда один пример разбросан по книге. Разметчик замечает некоторые куски, но не видит системы, результатом чего становятся упущенные примеры. Навык реферирования.

Типовая ошибка #14: Сокращение / Расширение фрагмента. 

При сокращении разметчик пытается выделить САМОЕ главное место / мысль, отсекая контекст. У него складывается иллюзия, что пример понятен. На практике, перечитав через неделю свой же фрагмент, Разметчик не помнит, о чем он. Или наоборот, Разметчик, страхуясь, захватывает лишние страницы текста, от чего пример теряется, и на этапе тегирования возникают сложности.  

Типовая ошибка #15: Водянистый текст.

Нередко встречаются авторы, которые «‎размусоливают» одну мысль на целую главу, а иногда и книгу. У неопытных Разметчиков складывается ложное впечатление «‎что-то в этом есть», но на выходе получается «‎смысловой нуль». 

Типовая ошибка #16: Первоисточники / Перепроверка данных. 

Для начинающих непривычно перепроверять данные, искать первоисточники, на которые опирается автор книги в своих утверждениях. Иначе написанное в книге ошибочно воспринимается как истина в последней инстанции.  

Типовая ошибка #17: Одна форма описания.

Вырабатывается привычка, что единица информации — фрагмент текста и ничто другое. Но формы могут быть разные, например, реферат. К слову, несмотря на то, что в школе всех учили писать рефераты / доклады, большинство людей делать это не умеет. 

Типовая ошибка #18: «Модельный признак» — ключевой параметр. 

Выбор неверного ключевого параметра фрагмента —концентрация на вторичном.

По материалам доклада А.А. Рыжачкова.
Следующая статья
Livrezon-технологии
Картотека тем Максима Горького
Из целой серии горьковских литературных портретов, посвященных писателям, наибольшее значение имеет опубликованный в 1919 году очерк «Лев Толстой». Это, может быть, самый замечательный, самый высокий образец очерка-портрета в русской и мировой литературе. В отличие от других портретов, этот очерк составлен из дневниковых записей конце 1901 – начала 1902 года, непосредственно данных в тексте (они были подвергнуты небольшой литературной обработке), и письма, написанного в ноябре 1910 года В. Г. Короленко, но не отосланного ему. Эта особенность дала повод для споров о том, как датировать произвед...
Livrezon-технологии
Картотека тем Максима Горького
Livrezon-технологии
Николай Рубакин о назначении библиотек
Педагогика и образование
«Основы дефектологии» Л. С. Выготского: концентрированный реферат – самое главное из книги
Livrezon-технологии
Quirky приемы письма от Фридриха Шиллера
Livrezon-технологии
Как с помощью книг поднять уровень знаний?
Livrezon-технологии
Известные писатели против прокрастинации
IT
Apple Vision Pro: революция или чемодан без ручки?
IT
Парадигмы софтов для дизайна интерфейсов
Livrezon-технологии
ДНЕВНИК ПЕДАГОГА. Запись #65: ТУР Гениев в гостях у звукорежиссера
Livrezon-технологии
ДНЕВНИК ПЕДАГОГА. Запись #64: ТУР Гениев в благотворительной организации «Ночлежка»
Livrezon-технологии
ДНЕВНИК ПЕДАГОГА. Запись #63: ТУР Гениев в гостях у риелтора
Livrezon-технологии
ДНЕВНИК ПЕДАГОГА. Запись #62: ТУР Гениев в гостях у компании «Нониус Инжиниринг»
Livrezon-технологии
А гострайтинг не так молод! Драматурги из «Собачьего зала»
Livrezon-технологии
Кто в доме wear the pants? Разбираем английскую идиому на стажировке YOUBE Club
Психология и психофизиология
Как хакнуть себе голову? Эффективно переключаем состояния на примере IT-специалистов
Livrezon-технологии
Терри Пратчетт и Нил Гейман: как два автора работали над «Благими знамениями»