Митасов Андрей Павлович : другие произведения.

Металоция неведомого. Модуль А. Текст

Самиздат: [Регистрация] [Найти] [Рейтинги] [Обсуждения] [Новинки] [Обзоры] [Помощь|Техвопросы]
Ссылки:
Школа кожевенного мастерства: сумки, ремни своими руками
 Ваша оценка:
  • Аннотация:
    Рекомендации по работе с текстом.
    Крайнее обновление 17.03.2024.

  
  Увидеть в капле океан!!
  
  А мы плывём по океану жизни
  И разум - стрелка компаса у нас.
  Нам страсть есть ветер, шторма, брызги...
  Любовь же - берег. И успокоений час.
  
  Но, только осознав, что в КАПЛЕ - океана бесконечность,
  Начнёшь ценить мгновения... По ним шагая в вечность...
  
  Риф Хуснутдинов
  
  
  01.03.2023 19:05
  
  Посвящается Алисе,
  поразившей меня совершенно неожиданным применением фразы
  "звездочка-точка-звездочка".
  
  Оглавление:
   "Дружеский совет" Гурджиева.
   Рекомендации по анализу текста.
   Направления и градации обучения.
   Анализ согласованности.
   Генерация/формулировка вопросов/мыслей/гипотез.
   Попытка понимания автора текста.
   Пример попытки понимания автора текста.
   Представление результатов анализа в базе знаний и "вахтенном журнале".
   Фрагмент "вахтенного журнала" о рождении темы "Шифрограмма Бартини".
   Использование ИИ-инструментов.
   Обоснование выбора термина "Мета-Лоция".
  
  Часть2. На пути от человеческого языка к языку ИИ-систем:
   Первые шаги по освоению возможностей ГПТ-моделей.
   Рекомендации по написанию текстов с помощью ГПТэшек.
   О законе Ципфа-Мандельброта.
   Больше статистик хороших и разных.
   Первые практические опыты использования ИИ-системы Бинг.
   Рекомендации по работе с диалоговыми ИИ-системам.
   Наблюдения о написании собственных текстов.
   Еще кое-что о написании собственных текстов.
   И снова рекомендации по работе с диалоговыми ИИ-системам.
   Об эмоциональных составляющих промпта.
   "Тарабарские" языки, используемые ИИ-системами.
   А что собственно считают текстом языковые модели?
   Промежуточные выводы о соотношении текста для человека и LLM.
  
  Информация к размышлению:
   Наблюдения за "равномерностью" памяти языковой модели.
   Как много точно помнит языковая модель?
   Пример статистического "распознавания" текста.
   Насколько работоспособно статистическое "предсказание" текста?
   Советы авторам текстов от редактора Хабра.
   Тексты ИИ-моделей пока более "плоские" чем авторские.
   Эмбеддинги отдельных терминов VS эмбеддинги окружения.
   Реальные перспективы промпт-инжениринга.
   О нео6ходимости промпт-грамотности замолвите слово.
  
  Иллюстрации:
   Триптих "Путь текста" от "Модели Kandinsky 2.0".
   Бригантина "Звездочка-Точка-Звездочка" от "Модели Kandinsky 2.1".
   Бригантина "Звездочка-Точка-Звездочка" от "Модели Kandinsky 3.0".
  
  =======
  
  18.02.2023 12:26
  
  "Дружеский совет" Гурджиева.
  В оглавление.
  
  Суббота. Можно и спокойно поработать.
  
  Итак "охи и ахи" по поводу ChatGPT и его аналогов все не утихают,
  хотя по-тихоньку приходит понимание, что реальный уровень этих
  ИИ-технологий сильно отстает от желаемого и обещанного.
  См., например, "Остап Бендер из мира нейросетей: как ChatGPT играет в шахматы"
  (автор VasiliyST)
  https://habr.com/ru/post/716216/
  
  Но и расслабляться сильно не стоит, есть и другие мнения
  см., например, "Настоящая личность ЧатЖПТ,
  или что будет с человечеством после поробощения"
  https://oko-planet.su/politik/politikdiscussions/694636-nastojaschaja-lichnost-chatzhpt-ili-chto-budet-s-chelovechestvom-posle-poroboschenija.html
  Источник: Олег Макаренко: Место для дискуссий.
  https://olegmakarenko.ru/2636554.html
  Но это скорее "прикол", а вот эта статья заставляет призадуматься
  "ChatGPT как инструмент проверки своих размышлений"
  (автор KasDim)
  https://habr.com/ru/post/718094/
  
  В любом случае стоит признать, что выиграть "гонку с ИИ",
  можно только "по своим правилам", не за счет количества перерабатываемой
  и тем более просматриваемой информации,
  а за счет глубины/качества обработки ЛЮБОЙ информации.
  То есть "брать не числом, а умением".
  Вот относительно того как это легче/логичнее/профессиональнее делать
  при обработке текстов и стоит немного по-рассуждать и что-то порекомендовать.
  Хочется надеяться, что кто-то найдет в этих рекомендациях
  что-то для себя полезное или просто интересное.
  
  Начну пожалуй с одной достаточно длинной, но интересной цитаты
  из предисловия к книге "Все и вся" Георгия Гурджиева
  http://www.6lib.ru/books/vse_i_vsa-39602.html
  
  \\\ ДРУЖЕСКИЙ СОВЕТ
  \\\ (экспромтом написанный автором
  \\\ при передаче этой книги, уже готовой к изданию, в типографию)
  
  \\\ На основании многочисленных выводов и заключений,
  \\\ сделанных мною во время экспериментальных изысканий,
  \\\ касающихся продуктивности восприятия современными людьми
  \\\ новых впечатлений из того, что они слышали и читают,
  \\\ а также на основании идеи одного изречения народной мудрости,
  \\\ дошедшего до наших дней с очень древних времен,
  \\\ которое я только что вспомнил и которое гласит:
  
  \\\ <Всякая молитва может быть услышана Высшими Силами,
  \\\ и может быть получен соответствующий ответ,
  \\\ только если она произносится трижды:
  \\\ в первый раз - о благоденствии или за упокой души своих родителей,
  \\\ во второй раз - о благоденствии своего ближнего,
  \\\ и только в третий раз - о самом себе>,
  
  \\\ я считаю необходимым дать на первой странице этой,
  \\\ вполне готовой к изданию книги следующий совет:
  
  \\\ <Читайте каждое из моих письменных изложений трижды:
  \\\ в первый раз - хотя бы так,
  \\\ как вы уже привыкли механически читать все свои современные книги и газеты,
  \\\ во второй раз - как если бы вы читали вслух другому человеку,
  \\\ и только в третий раз - постарайтесь понять суть моих писаний>.
  
  \\\ Только тогда вы сможете рассчитывать на создание своего собственного,
  \\\ присущего только вам,
  \\\ беспристрастного суждения о моих писаниях.
  \\\ И только тогда может осуществиться моя надежда,
  \\\ что вы извлечете для себя,
  \\\ соответственно своему пониманию,
  \\\ ту особую пользу,
  \\\ которую я ожидаю и которую я желаю вам всем своим существом.
  
  =======
  
  Рекомендации по анализу текста.
  В оглавление.
  
  После осмысления этой цитаты самостоятельно, можно сразу же попробовать
  сформулировать то, что можно "извлечь для себя, соответственно своему пониманию"
  и с учетом "краевых" и "граничных" условий,
  особенно ограниченности ресурса времени.
  
  Во-первых, относительно многократного прочтения -
  вещь как видимо, нужная, полезная, и в ряде случаев неизбежная.
  Особенно когда уже точно не помнишь, работал ли с данным конкретным текстом
  или его вариантом, и, самое главное, когда сам или твое "миропонимание",
  существенно изменились. Просто так "зачитывать до дыр" без изменения,
  так сказать, "точки сборки", т.е. своего подхода, накопленных знаний,
  уровня понимания, и просто текущих задач, наверно, особого смысла не имеет.
  Исключение, конечно, состовляют те тексты, которые читаешь, чтобы снова
  и снова, погрузиться в так полюбившийся мир автора, или насладиться
  его внутренней поэзией, музыкой, ритмом, образами или героями.
  
  Во-вторых, и это более практично сразу по многим параметрам,
  при любом прочтении стараться пытаться мыслить одновременно.
  как минимум, в трех плоскостях/направлениях/измерениях.
  
  Первое - это проверка соответствия данного материала тому, что уже известно,
  от родителей, учителей, учебников, новостей и.д.
  
  Второе - формулировка вопросов/мыслей/гипотез, которые возникают при прочтении,
  и, которые хотелось бы тут же обсудить с друзьями/коллегами, с самим автором,
  и даже только с самим собой (и такое бывает).
  
  Третье, и, наверное, самое трудное, но, одновременно, и самое практичное,
  попытаться понять стиль, логику, мысли, мировоззрение автора.
  
  У каждого направления свои задачи и свои методы.
  
  Первое направление обеспечивает информацией, подтверждением/опровержением,
  каких-то уже "устоявшихся" представлений, так сказать, "отдел контроля
  строительных блоков/материалов".
  
  Второе - обеспечивает новыми мыслями/идеями/гипотезами, т.е подготавливает
  "строительную площадку" для восприятия/построения чего-то нового.
  
  Третье - новыми приемами/способами/структурой мышления, т.е обеспечивает
  "строительными механизмами" для выстраивания желаемой "конструкции",
  но не только, и не столько в этом дело. Это отдельная тема/вопрос,
  который постараюсь осветить чуть ниже.
  
  Ну и четвертое направление, которое собственно всегда присутствует,
  при работе с любым текстом - это та задача, которую решаешь самыми различными
  способами, и ради которой, собственно и взялся работать с данным текстом.
  
  Разумеется, этими направлениями, можно не ограничиваться,
  у каждого есть своя собственная, только ему свойственная "фишка",
  "метод", "кочка зрения". Но для начала и этого может быть достаточно.
  Со временем появится и еще что-то. Но с чего-то все же надо начинать.
  
  Собственно такая "многомерность" внимания, а вслед за ним и мышления,
  и есть тот способ обеспечения такого качества восприятия/обработки текста,
  который пока не доступен ИИ, во всяком случае, пока не начнется
  применение многомерных "моделей обучения".
  Тут главное понимание того, что активизируя собственное "внимание",
  мы тем самым включаем в работу наши "встроенные алгоритмы обучения",
  а они пока на несколько порядков эффективнее применяемых в ИИ,
  для обучения "себя любимого" "многомерному мышлению",
  т.е. уходу от "одномерного логического базиса" куда-то "дальше и выше",
  в нужном только Вам направлении.
  
  Тут особо нет ничего сложного, хотя требует и определенных усилий и времени,
  но это регулируется самостоятельно, по желанию, "самочувствию", результатам
  и т.п. Важно только понимать, процессом обучения такому "многомерию"
  можно управлять. Например, по схеме предлагаемой ниже.
  У каждого, конечно, может быть своя любимая форма/порядок обучения,
  и если он вполне осознаваем и результативен, то вполне может быть применим.
  В этом вопросе, наверно, особых "канонов" нет,
  но и особого разнообразия тоже. Есть, в общем два подхода,
  один основан на "понимании", другой на "запоминании" и куча промежуточных
  или комбинированных.
  
  Процесс обучения, который выстроен от "понимания", естественно,
  обычно более быстр, но труднее и, самое главное, не гарантирован,
  в силу большей "привязки" к индивидуальным "особенностям" обучаемого.
  Процесс обучения, который построен на "запоминании" обычно дольше,
  но он более гарантирован, что обеспечивает его применение в самых
  разных областях. Поэтому и в данном случае предлагается такой подход.
  Ну а что кому больше подходит. если пробовать обучаться азам
  "многомерного" внимания/мышления, пусть решает для себя сам.
  
  =======
  
  Направления и градации обучения.
  В оглавление.
  
  Предлагаемый подход обучения включает в себя несколько этапов,
  некоторые из них можно считать "каноническими",
  и по ним достаточно много справочной литературы.
  
  Первый этап - "на правильность действий".
  Тут вроде из самого названия все понятно,
  только нужно решить по каким критериям оценивать эту "правильность".
  Тут могут быть и контрольные вопросы, и таблицы связности,
  ну и контрольные примеры/задачи. Кому что привычнее.
  
  Второй этап - "на быстроту".
  Тут тоже из названия должно быть понятно, что и как оценивать.
  
  Третий этап - "на автоматизм".
  Тут оценка чуть по-хитрее. Требуется отследить действительно ли
  при разборе ЛЮБОГО текста/ситуаций "срабатывают" доведенные "до автоматизма"
  методы включения внимания и параллельно с ним приемы анализа/генерации
  чужих и собственных мыслей/высказываний.
  
  Четвертый этап - "на профессионализм".
  Этот этап уже не совсем "канонический", в том смысле, что по нему
  литературы можно и не найти. Смысл его в том, чтобы выработать умение
  ОСОЗНАННО выбирать какой-то один из нескольких отработанных приемов/методов,
  или, наоборот, целый комплекс освоенных или только осваиваемых методов
  для достижения нужной цели. Где-то здесь в любом случае начинает происходить
  переход от "запоминания" к "пониманию".
  
  Пятый этап - "на артистизм".
  Это когда использование освоенных методов уже не только "функционально"
  и "эффективно", но еще и внешне настолько красиво, что создается
  ощущение настоящего произведения искусства.
  Понятно, что здесь без "понимания" обойтись уже весьма затруднительно.
  
  Шестой этап - "на магизм".
  Это когда "произведение искусства" присутствует как на внешнем
  так и внутреннем уровне использования освоенных методов.
  И все это вместе выглядит как "истинная магия".
  Так как для понимания того, что и как делается для достижения результата,
  требуется очень глубокое понимание, а не набор заученных,
  хоть и весьма заковыристых, "формул заклинаний".
  
  Но и это, скорее всего, не предел совершенства,
  уже просматривается, что, похоже, есть уровень - "на шаманизм",
  с "призывом дружественных духов" и "противостоянию с недружественными духами".
  Тут уже требуется совершенно иной уровень понимания и используемых методов.
  Наверно, и дальше что-то есть, но это, скорее всего, узнаем когда-нибудь потом.
  
  Пока вполне достаточно стараться выйти на уровень "профессионализма".
  Это еще, наверно, можно попытаться как-то изложить/представить в виде
  более-менее общего материала/курса.
  Дальше только самостоятельное и строго индивидуальное обучение/развитие.
  
  Это, так сказать, набросок плана этапов обучения.
  Теперь собственно по "предметам", точнее по направлениям обучения.
  
  =======
  
  Анализ согласованности.
  В оглавление.
  
  Направление первое. Анализ согласованности.
  
  Здесь только проверяется "что-то" на соответствие "чему-то".
  Этакие "фильтры-обнаружители". Или "детекторы" согласования и рассогласования.
  
  Цель этого анализа
  Во-первых: не устарела ли используемая "база знаний"
  и набор применяемых методов/критериев. По большому счету, не изменилось ли
  что-то в мире по сравнению с тем, что рассказывали в школе/институте/учебнике.
  Если такие изменения произошли, или появились какие-то новые не тривиальные
  факты, концепции. методы и т.д., то ставится соответствующая "пометочка".
  Это больше всего похоже на простой сбор "первичных данных".
  
  Во-вторых: нет ли каких-то противоречий с используемым в "базе знаний"
  концепциям/парадигмам. Вроде почти тоже самое, но уже более специализированное,
  т.к. "используемые парадигмы" могут быть сугубо личными, и далекими
  от "канонических". Тут пометочки ставятся "по-жирнее".
  Это уже больше похоже на поиск действительно нового и важного.
  
  В-третьих: попытаться обнаружить в построениях автора, каких-то
  пропусков, "разрывов" логики, изложения материала, внутренних противоречий,
  и, наоборот, удачных терминов/фраз/пояснений, красивых логических построений,
  новых подходов, хороших цитат, в общем все чем можно в будущем воспользоваться.
  Ну и здесь тоже требуются "пометочки", но уже другого вида.
  
  Самое, главное, чего следует избегать в этом направлении анализа,
  это попытка "по-быстренькому" сделать окончательный вывод о классификации
  текста как "мусорный"/ненужный, или отнести автора к "фуфлогонам".
  Торопиться не надо. Даже если такая оценка и верная,
  то можно ведь рассматривать текст/автора, как пример,
  того что не должно попадаться при следующем анализе,
  чтобы сэкономить драгоценное время,
  и имеет смысл "отточить" приемы/критерии/маркеры "раннего обнаружения"
  такого рода текстов.
  
  Например, обратить внимание на время появления текста.
  К примеру, на Хабре в выходные дни появляется в три-четыре раза меньше
  публикаций чем в рабочие дни. Т.е. большая часть публикаций происходит
  в "рабочее время" и, скорее всего, с "рабочего места", возникает
  подозрение, что это не просто "порыв души" "вольных художников".
  а выполнение "рабочего задания" в рамках пиар-компании "себя любимых".
  Наличие в таких материалах ссылок на соответствующие сайты,
  служит дополнительным подтверждением, что данный материал больше
  подходит под классификацию "реклама" с соответствующим уровнем доверия
  и требует соответствующей "перенастройки фильтров".
  
  =======
  
  Генерация/формулировка вопросов/мыслей/гипотез.
  В оглавление.
  
  Направление второе. Генерация/формулировка вопросов/мыслей/гипотез.
  
  По сделанным "пометочкам", или даже лучше вместе или вместо них,
  попытаться сформулировать и записать, если требуется,
  возникающие при "срабатывании "детекторов" очевидные,
  а лучше неочевидные мысли. Это помогает "разгрузить оперативную память",
  и лучше "настроить фильтры", для продолжения анализа текста,
  или, если что-то обнаружилось "из ряда вон", откатиться назад,
  для лучшего понимания логики или стиля изложения автора.
  
  Цель анализа в данном случае подтолкнуть воображение,
  чтобы попытаться или развить мысль автора, или попытаться его опровергнуть,
  или даже попытаться решить/развить какие-то свои, не связанные с данным текстом,
  вопросы/концепции. Например, "позаимствовать" красивую цитату.
  Или занести указанную в тексте ссылку/автора в список перспективных
  для дальнейшего рассмотрения материалов.
  
  Кстати, вот такие, казалось бы, тривиальные действия, несут и определенные
  "разгрузочные" психологические функции. "Все-таки не зря время потратил"
  или "О это еще пригодится" или "Ну наконец я высказал, что хотел" и т.п.
  
  Отдельный вопрос на этом направлении анализа это используемая логика
  автора и Ваша собственная. Они, как правило, различны,
  особенно если под логикой понимать "метод построения умозаключений".
  Логик на самом деле очень много, и уж точно не исчерпываются
  классической логикой "исключенного третьего".
  Но это отдельная большая тема.
  (Надеюсь еще удасться ее раскрыть хотя бы эскизно.)
  Важно помнить, что есть много логик "хороших и разных",
  и Ваша собственная, не всегда "единственно верная",
  и к тому же она со временем, и может даже с каждым прочитанным текстом,
  и просто с возрастом, понемногу изменяться,
  причем, незаметно для Вас самих.
  
  =======
  
  Попытка понимания автора текста.
  В оглавление.
  
  Направление третье. Попытка понимания автора текста.
  
  Вот тут придется постараться - задача не простая, но, с другой стороны,
  более-менее привычная/знакомая. Так или иначе, мы общаемся с разными людьми
  и так или иначе нам приходится пытаться их понять или, как минимум,
  составить о них какое-то представление.
  
  Попробуйте рассматривать любой текст как развернутую "визитку" автора,
  где указаны не только его "реквизиты", но и "фотография" его знаний, логики,
  кругозора, мировоззрения, научной и человеческой этики и много чего еще,
  включая и отношение к другим "представителям человечества" в лице читателей.
  И задача заключается в умении не просто "читать между строк",
  а воссоздавать целое "художественное полотно", "драматическую постановку,
  где автор только одно из "действующих лиц".
  
  Конечная цель этой реконструкции составить мнение о степени доверия
  к анализируемому материалу. Оценить насколько автор близок к решению
  поставленных им задач, как явно декларируемых, так и неявно присутствующих
  в данном тексте. Оценить насколько перспективно предлагаемое им направление.
  Прикинуть какие проблемы требуется для этого решить, какие ресурсы
  требуется задействовать. Ну и, естественно, попытаться понять
  какие указанные и неуказанные автором "подводные камни" лежат на этом пути.
  
  Для решения этой задачи можно анализировать уже не только логику,
  но и стиль изложения автора, и форматирование, длину предложений,
  пояснения к формулам и даже состав и порядок расположения
  источников в списке литературы. При этом, не забывая учитывать
  такие немаловажные ограничения накладываемое на авторов публикаций
  в "бумажных журналах" как ограничение на длину статьи и др.
  То как автор решает этот вопрос, иногда может сказать об авторе
  много больше чем список титулов. Ниже приведу пример.
  Кстати для более полного понимания тех или иных публикаций,
  и, соответственно, их авторов, не лишне ознакомиться с историей
  и редакционной политикой журналов, в которых появились эти публикации.
  Тогда становятся более понятными некоторые "ритуальные па",
  или, наоборот, "иезуитская изощренность" некоторых приемов,
  казалось бы совершенно нелогичных без учета этих факторов/нюансов.
  
  Почему я считаю, что это направление одним из важнейших
  при анализе текста?
  Сразу двум причинам, хотя их на самом деле их может быть больше.
  
  Первая причина чисто утилитарная - такой подход обычно помогает лучше понимать
  не только текст сам по себе, но просто обучает и в привычных жизненных ситуациях
  лучше понимать людей, то что они явно или не явно пытаются донести
  и до тебя, и до начальства, и до подчиненных.
  
  Вторая причина более возвышенная - любой текст это проявление одной из
  доступной человеку магии - "магии слова". Пример удачного или "не очень"
  ее применения с соответствующим результатом.
  
  Лично я не теряю надежды когда-нибудь освоить эту "школу магии"
  на более высоком уровне, чем нынешний.
  Чего и Вам желаю.
  
  =======
  
  19.02.2023 9:51
  
  Пример попытки понимания автора текста.
  В оглавление.
  
  Попробую привести иллюстрацию к последнему разделу
  из все той же темы поиска по "шифрограмме Бартини".
  Возможно, получится несколько пространно.
  но кратко, боюсь, в данном случае у меня не получится,
  т.к. потребуется некоторое введение в "проблематику".
  
  В середине 60-х годов прошлого столетия в Советском Союзе
  вышли из печати две почти идентичные публикации по теме
  "устроения" Вселенной за авторством известного в то время
  только в очень узких кругах авиаконструктора Роберта Бартини.
  Первая в "Докладах Академии Наук СССР" (ДАН) от 1965г Том. 163 ?4, стр. 861 - 864.
  Вторая в сборнике статей "Проблемы гравитации и теории элементарных частиц"
  под редакцией д-ра техн. наук проф. К.П.Станюковиа
  и канд. физ.-мат. наук Г. А. Соколика,
  Издательство Атомиздат, Москва, 1966 стр. 249 - 266
  
  В них Бартини рассматривая некий "тотальный и, следовательно,
  уникальный экземпляр A", используя какую-то "гремучую смесь"
  совершенно различных математических подходов и терминологий,
  каким-то образом получает формулы для вычисления фундаментальных
  физических констант и в конце заключает:
  
  \\\ Совпадение теоретических и наблюдаемых величин констант
  \\\ позволяет предполагать,
  \\\ что можно отождествлять все метрические свойства
  \\\ рассматриваемого тотального и уникального экземпляра
  \\\ со свойствами наблюдаемого Мира,
  \\\ тождественного с единственной фундаментальной <частицей> А.
  \\\ В другом сообщении будет показано,
  \\\ что (3 + 3)-мерность пространства - времени
  \\\ является экспериментально проверяемым фактором
  \\\ и что 6-мерная модель свободна от логических трудностей,
  \\\ созданных (3+1) -мерной концепцией фона.
  
  Публикации вызвали значительное "волнение в некоторых научных кругах".
  Как-никак Бартини поставил под сомнение, а то и вообще "замахнулся"
  на целое стадо "священных коров" физики того да и сегодняшнего времени,
  начиная с канонического "пространства Минковского", и тем самым
  "бросая тень" на "самого Эйнштейна", и заканчивая уже откровенной
  "бредятиной" в виде формы зависимости "МИРОВЫХ констант" от какой-то там
  "пи со звездочкой".
  
  Разобраться в конспективной записи "математико-логических" построений
  похоже мало кому удалось, а те, кто что что-то знал, например,
  академики Боголюбов и Понтекорово, помалкивали, что в общем-то, наверно,
  не удивительно, из-за довольно "закрытого" статуса и самого Бартини,
  да и их самих тоже. Остальные же терялись в догадках.
  
  Так как "другого сообщения" с "экспериментальным подтверждением" так
  и не появилось, да и сам Бартини, ничего вроде именно по этой теме
  не публиковал, хотя это и не совсем так.
  То "самые неугомонные" начали выдвигать версию,
  что "тотальный, а потому уникальный экземпляр" не более чем
  "неуместная шутка", известного любителя розыгрышей,
  попавшей на страницы "священной летописи ДАН всех истинных ученых"
  в результате "проигрыша в карты" академика Понтекорово инженеру Бартини,
  и поэтому, вынужденному представить любой "наукообразный бред"
  для публикации в ДАН. Кстати, до сих пор эту версию очень часто озвучивают,
  в публикациях об автоматической генерации текста.
  
  Тут надо дать некоторое пояснение со статусом ДАН.
  "Доклады Академии Наук СССР" (все обязательно с большой буквы)
  были и остаются на протяжении веков ВЫСШЕЙ степенью фиксации
  научных достижений, закрепляющий на вечные времена авторство
  и приоритет научного открытия. И это далеко не тот самый пресловутый
  "копирайт", который покупается и продается.
  Это навсегда, и это "печать" подтверждения истинности.
  Вот как это оформлено в "Правилах для авторов" ДАН:
  
  \\\ 1. В <Докладах Академии наук СССР>
  \\\ помещаются краткие сообщения,
  \\\ содержащие наиболее существенные результаты
  \\\ новых исследований в области математики, естествознания и техники.
  
  \\\ Сообщения эти должны излагать законченные,
  \\\ еще не опубликованные результаты научных исследований,
  \\\ имеющих характер новизны - теоретической или методологической.
  
  \\\ 2. В <Докладах> не помещаются крупные статьи,
  \\\ механически разделенные на ряд отдельных сообщений,
  \\\ статьи полемического характера без новых фактических данных,
  \\\ статьи с описанием промежуточных опытов
  \\\ без определенных выводов и обобщений,
  \\\ работы описательного или обзорного характера,
  \\\ чисто методические статьи,
  \\\ если предлагаемый метод не является принципиально новым,
  \\\ а также статьи по систематике растений и животных,
  \\\ за исключением описания особо интересных для науки находок.
  
  \\\ Редакция оставляет за собой право отклонять серийные статьи,
  \\\ в которых приводятся новые факты в одной и той же научной области,
  \\\ если методика работы и метод обработки результатов эксперимента
  \\\ уже описаны в ранее опубликованных статьях.
  
  \\\ 3. Статьи всех авторов, кроме членов-корреспондентов Академии наук СССР
  \\\ и академиков академий наук союзных республик,
  ////// Кстати обратите внимание на "субординацию" заглавных букв
  ////// в слове "академия".
  \\\ печатаются в <Докладах> по представлению академиков АН СССР.
  \\\ Статьи, не имеющие представления,
  \\\ редакцией не принимаются к рассмотрению.
  
  \\\ Редакция просит академиков при представлении статьи
  \\\ указывать дату получения ее от автора,
  \\\ а также научный раздел, в котором статья должна быть помещена.
  
  .....
  
  \\\ 5. <Доклады> помещают статьи,
  \\\ занимающие не более четырех печатных страниц, включая рисунки.
  \\\ Число рисунков не должно превышать четырех.
  
  ......
  
  И это только "писанные" правила, а сколько еще "неписанных"...
  
  Но теперь вернемся собственно к "шифрограмме",
  заканчивается то она не выводом или примечанием,
  а вот таким абзацем:
  
  \\\ Автор выражает благодарность Н. Н. Боголюбову, В. М. Понтекорво
  \\\ и С. С. Гирштейну за обсуждение работы,
  \\\ а также П. С. Кочеткову, помогавшему произвести отдельные вычисления
  \\\ и 3. И. Ивановой-Зенкович Т. Н. Елецкой и М. Я. Истоминой,
  \\\ выполнившим расчет экстремумов функции Фn.
  
  \\\ Поступила 23 IV 1965
  
  Анализируя два варианта статьи, замечаешь интересные особенности,
  во-первых в более полной и обширной версии (в сборнике Станюковича)
  есть и дополнительные разделы, и иллюстрации, и более длинный список
  вычисленных констант, и достаточно авторитетный список литературы.
  А вот слов благодарности уже нет. Что это?
  Загадка, упущение, небрежность, или "черная неблагодарность".
  А может, наоборот, подсказка "гения авиастроения"?
  
  Если исходить из версии "розыгрыша", то все указанные
  в "абзаце благодарности" имена либо вымышленные, либо реальные,
  либо "и то и то". но реальные имена - люди известные и действительно
  "участвовали в обсуждении", а те кто "выполнял расчеты" -
  имена совершенно никому неизвестные, и в науке точно не имеющие
  никакого авторитета - их то еще к чему приплетать, да еще и женщин.
  Если это конечно "розыгрыш".
  Ну как-то это у меня не вязалось с образом "красного барона".
  
  Даже как-то задавал где-то на форуме вопрос об оценке
  этого абзаца людям посвятившим всю жизнь науке.
  Ответили, что вообще-то практика выражения благодарности всем
  как-то участвующим в научной работе, даже студентам,
  достаточно распространенная, хотя и не обязательная,
  зависит от "этических ценностей" авторов публикаций.
  На следующий вопрос "Можно ли найти аналогичные примеры именно В ДАН?",
  уклончиво ответили, что в ДАН слишком жесткие требования
  к размеру статей, но примеров аналогичных благодарностей
  даже академикам именно в ДАН приведено не было.
  
  Действительно статья Бартини по размеру, вместе с благодарностями
  укладывается, жесткие рамки ДАН, буквально "тютелька в тютельку",
  может быть еще одну или две строчки можно добавить и то без гарантии,
  что не "завернут" статью, сославшись на "пункт пятый".
  При этом опущено как вводное слово, так и ряд промежуточных формул
  и поясняющих фраз, плюс таблица констант прилично урезана,
  ну и иллюстрации и ссылочная литература выброшены без остатка.
  Видно, что пришлось "немного" повыкручиваться,
  но при этом включить "абзац благодарности" в ущерб "наукообразию"
  и "респектабельности". Как-то не логично для "розыгрыша".
  
  А если это НЕ розыгрыш, а именно что-то реально ПРИНЦИПИАЛЬНО новое?
  Тогда все логично/складно. Автор убежден в правильности изложенного
  материала, и как человек "благородных кровей" выражает признательность
  всем причастным к этой работе. Но при этом четко разделив на тех,
  кто только "обсуждал" и тех кто в меру сил честно "помогал" и "выполнял"
  работу, наверняка, внешне казавшейся совершенно бессмысленной.
  И тем самым как бы уравнивая "генералов науки" и "рядовых
  тружеников научного фронта и тыла".
  Оставить в истории науки имена не только академиков и референтов,
  но и простых расчетчиц.
  А может быть сказать и еще что-то очень важное.
  Красиво и элегантно - не подкопаешься.
  Очень в стиле инженера, всегда старающегося использовать одну и ту же
  деталь/конструкцию для выполнения разных, порой противоречивых функций.
  
  В общем, лично меня анализ этого абзаца послужил очень важным
  аргументом относится к "шифрограмме" как "произведению искусства",
  а не "дешевому розыгрышу".
  
  Хотя элементы "розыгрыша" или "шарады", как мне кажется,
  в ней все-таки присутствуют, но совсем не там, где это обычно ищут.
  Все-таки есть у Бартини свой "личный почерк" и особое чувство юмора.
  
  Интересно, что когда обдумывал/записывал эти последние абзацы,
  сообразил, что человек, знающий некоторые нетривиальные способы ухода
  от наружной слежки, наверняка знает и правила составления
  шифрованных сообщений и, наоборот, правила их декодирования.
  И если в тексте есть действительно "шарада",
  то по правилам "хорошего тона" должны быть и ключи к ее разгадке.
  И кажется, что один такой фрагментик удалось "зацепить" только сейчас.
  
  Ну и чтобы как-то завершить этот затянувшийся раздел,
  укажу ссылки на две фотографии Бартини.
  
  До публикации "шифрограммы".
  https://tovievich.ru/uploads/posts/2015-11/1448127453_hqdefault.jpg
  
  И уже после.
  https://s09.stc.yc.kpcdn.net/share/i/12/11551833/wr-960.webp
  
  И еще. Пока искал фотографии, наткнулся на текст с "обзором" этой темы
  немного "желтоватый" - ну таковы уж "законы жанра" у КП
  (один анонс чего стоит -
  "<Комсомолка> расшифровала послание учителя Королева и соратника Келдыша").
  - но для меня текст не безинтересный. Есть кое-что новенькое.
  Буду сейчас прорабатывать.
  
  /////// Н-да. Почитал по внимательней. Тут, похоже, не "расшифровка",
  /////// а наоборот "закапывание темы" изо всех сил и умений.
  /////// Просто "хрестоматий пример" как это делается в "желтой прессе".
  /////// Автор очень старался, но в кое-чем "прокололся"
  /////// и кое-что подсказал. Спасибо - и из "такого" можно полезное выковырять.
  /////// Интересно, сделал он это по "широте душевной" или
  /////// "не корысти ради, а токмо волею пославшей мя жены...".
  /////// Наверно придется сделать небольшое "журналистское расследование".
  /////// Где только время взять, но тут похоже дело принципа.
  ////////// Проглядел другие публикации и ничего не понял.
  ////////// Эта конкретная статья резко отличается от других.
  ////////// Опять какие-то "непонятки".
  
  Если кому стало интересно, хотя бы чтобы сравнить подходы,
  то вот ссылка:
  "Самый загадочный текст советской науки:
  Авиаконструктор Роберт Бартини 55 лет назад
  показал человечеству выход из Матрицы."
  Автор Евгений АРСЮХИН.
  https://www.kp.ru/daily/217172.5/4273985/
  
  =======
  
  01.03.2023 6:36
  
  Представление результатов анализа в базе знаний и "вахтенном журнале".
  В оглавление.
  
  Чтобы как-то "раскочегарить" непростую тему о представлении результатов
  знакомства/чтения/анализа текста предлагаю познакомиться с таким текстом
  "Знания на экране монитора. Чему меня научило ведение базы знаний?"
  автор flowing_abyss
  https://habr.com/ru/post/717458/
  
  Текст большой - у меня на его проработку ушло два вечера.
  Поэтому для тех кому лениво читать самому попробую сформулировать
  какую-то выжимку из текста, хотя на самом деле там в тексте намного
  больше достаточно интересных мыслей, и с которыми я не совсем согласен.
  //// Но я, вообще, мало с кем полностью согласен,
  //// так что стоит и это тоже учитывать.
  
  В данном тексте проводит мысль, что "знание есть связи",
  и для их "присвоения" (такова терминология автора),
  оптимальным способом является создание "базы знаний"
  в виде реляционной базы данных, в которой эти связи явно фиксируются
  и постоянно редактируются.
  
  Плюсы такого подхода:
  
  - набор типовых вопросов/критериев/направлений для анализа, оценки
  и представления результатов обработки текста;
  
  - быстрый доступ к сформированной системе "связей",
  с возможность использования различных фильтров/скриптов;
  
  - возможность связывания различных типов данных в виде текста, ссылок,
  иллюстраций, видео и т.п.;
  
  - формирование определенной системности мышления.
  
  Недостатки такого подхода:
  
  - необходимость с самого начала продумывать всю структуру базы знаний,
  с учетом возможного последующего расширения;
  
  - относительно большая трудозатратность при ведении базы;
  
  - чудовищные трудозатраты при "перекраивании" уже наработанной базы;
  
  - невозможность/нетривиальность таким способом отразить сложные, неоднозначные,
   многомерные и, зачастую, противоречивые "связи";
  
  - и, самое главное на мой взгляд, "экранирование" понимания,
   что "знание" - это не только "связи", но и много чего еще
   и, отнюдь, нетривиального - как минимум, вся логика и вся метафизика
   (это отдельная очень большая тема - надеюсь, еще дойдут и до этого руки).
  
  Отдельный вопрос об отношении "мастера и инструмента".
  В указанной статье автор считает достоинством, что в результате
  такой работы с "базой знаний" его мышление изменяется так,
  что он сам становится "продолжением инструмента".
  
  На мой взгляд такие взаимоотношения "мастера и инструмента"
  целесообразны на первых этапах обучения
  - "на правильность", "на быстроту", "на автоматизм" -
  и то с некоторыми оговорками.
  На уровне "профессионализма" уже инструмент
  должен становиться "продолжением мастера".
  На уровне "артистическом"
  мастер и инструмент должны становится взаимными "отражениями",
  может быть "инверсионными".
  На "магическом" уровне "мастер и инструмент" уже должны
  сливаться во что-то единое целое, уже неразделимое внешнему взгляду.
  
  Основное возражение к данной "тактике дОбычи знаний" попробую
  сформулировать в терминах истории "воинского искусства".
  Предлагаемая автором "тактика", трансформирующаяся у него еще и в "стратегию",
  это "непобедимая фаланга Александра Македонского",
  со всеми ее плюсами и минусами, в которой каждый "элемент", "локоть к локтю",
  жестко связан с соседом, прикрыт с тыла тремя рядами таких же "элементов",
  в виде ссылок, цитат, мнений авторитетов и т.д.
  
  При этом автор мало того, что не различает тактику и стратегию,
  что в жизни обычно ведет к катастрофе, так еще и историю плохо знает.
  Пешая фаланга, на самом деле, у Александра не решала исход сражения,
  а только связывала силы противника, а решающий удар в обход наносила
  конная "фаланга", возглавляемая самим Александром.
  Такая у него была "военно-техническая" новация.
  
  Если продолжить эту аналогию, то за фалангой, были изобретены манипулы,
  каре, колонны, рассыпной строй, цепи, штурмовые группы и т.д. и т.п.
  Смысл в том, что задачи требующие решения в самых разных условиях
  не могут решаться какой-то одной "тактикой", тем более переходящей
  в "стратегию". Все зависит от конкретных условий, задач и "стиля".
  
  Вот с этой точки зрения и стоит подходить к фиксации, представлению
  результатов анализа текста.
  
  Безусловно, использование таких инструментов как база данных
  может быть весьма целесообразно для систематизации,
  интересных ссылок, материалов, цитат, различных точек зрения и т.п.
  И это можно и нужно практиковать с самого начала,
  хотя бы для того, чтобы обучиться еще одному инструменту,
  еще одному подходу. Но делать ставку только на него,
  на мой взгляд, крайне не разумно. Из своего опыта знаю,
  что "угадать" и даже спроектировать "долгоживущую" структуру базы данных,
  ой как не просто, и какие усилия приходится предпринимать,
  что бы при изменении этой структуры "все нажитое непосильным трудом"
  не накрылось "медным тазом".
  Поэтому совет к тем кто хочет попробовать технику баз данных
  для фиксации и использования результатов анализа -
  формировать структуру максимально гибкую, свободную,
  и, особенно на первом этапе, не использовать реляционные связи
  между "элементами". Дождитесь хотя бы третьей "инкарнации" этой базы.
  
  На мой взгляд, наиболее работоспособной альтернативой, хотя и не полной,
  для фиксации результатов анализа текста является ведение текстового лога,
  или в моей терминологии "вахтенного журнала".
  Причем, как минимум, по трем причинам.
  
  Первая, самая простая,
  это легко осваивается, легко применяется, ничего не стоит кроме труда,
  легко трансформируется/дополняется/перерабатывается,
  с сохранением всей истории поисков, размышлений и находок.
  При этом функции ссылок и таблиц можно реализовывать
  через применение хэш-тегов или ключевых слов,
  которые формируются по мере необходимости,
  а поиск их реализовывать стандартными средствами поиска по файлам.
  
  Как это сделать в базе данных также удобно пока не представляю,
  но наверно как-то можно, но скорее всего, не на данном уровне технологий.
  Если кто-то когда-то "прикрутит" к базе данных языковой интерфейс
  по типу ChatGPT с возможностями индивидуальной настройки,
  тогда может ситуация и изменится. Поживем - будем посмотреть.
  
  Вторая, более важная,
  это гибкость и свобода выбора/добавления/выражения
  всяческих пометок/замечаний/оценок/выводов относительно самого текста,
  автора текста и "себя любимого". Например, оценка используемого автором
  стиля изложения, или, казалось бы, совершенно несущественного аспекта
  текста как форматирование. А ведь форматирование, может очень многое
  сказать и о тексте и об авторе.
  Например, абзац на две страницы -
  о чем это может свидетельствовать?
  - Принятый автором стиль изложения?
  - Неумение/невозможность структурировать мысль?
  - Попытка показать основательность излагаемого тезиса?
  - Или "поток сознания", когда не находится слов для четкой формулировки,
   и делается попытка заместить "ясность" подобием "основательности"
   или "широтой охвата"?
  
  И таких аспектов в каждом конкретном случае/тексте при желании/необходимости
  найдется "вагон и маленькая тележка". Можно ли это заранее спрогнозировать
  и соответствующим образом спроектировать "базу знаний",
  представляется маловероятным.
  Да отдельные "элементы" - можно, отдельные типовые "связи" - тоже можно,
  но весь постоянно расширяющийся комплекс и "связей" и "элементов",
  наверно, все же нет.
  
  Ну и третья, самая главная,
  это необходимость самостоятельно писать свой текст, как реакцию на чужой.
  При этом лучше понимаешь и сам текст и автора,
  и ... трудность донесения авторской мысли до читателя в полном объеме
  посредством текста, стилистических приемов, или того же форматирования.
  Приходит понимание, что не только текст, а даже удачная фраза, слово,
  и просто знак препинания могут принципиально изменить все понимание текста,
  и даже чего-то большего.
  Тут безусловный лидер хрестоматийных примеров - это "казнить нельзя помиловать",
  но мне больше в этом отношении нравится "Вариант Омега" с Олегом Далем.
  
  Тут стоит использовать такой образ "звездочка-точка-звездочка",
  где первая "звездочка" это "Вселенная смыслов автора",
  вторая "звездочка" это "Ваша личная Вселенная понимания",
  а точка это сам текст/фраза/слово, соединяющая, или разделяющая,
  одну "вселенную" от другой.
  
  Причем, "точку" нужно понимать не в "смысле Евклида",
  т.е. "нульмерную абстракцию", что-то там "обозначающую",
  не в "смысле Демокрита", т.е. "неделимого, но минимального, атома",
  а в "смысле Пифагора", у которого "точка" - это символ "монады"/Абсолюта,
  т.е. фактически свернутой в точку Вселенной со своими,
  частично постижимыми законами.
  
  И нахождение/распознавание в тексте таких "точек"
  и есть главная задача и главный приз при проведении анализа.
  Могущий кардинально изменить практически все.
  
  Ниже приводится реальный фрагмент "вахтенного журнала"
  как раз для иллюстрации всего выше сказанного.
  
  ========
  
  27.02.2023 7:11
  
  Фрагмент "вахтенного журнала" о рождении темы "Шифрограмма Бартини".
  В оглавление.
  
  В качестве иллюстрации/примера оформления результатов выводов/анализа
  при обработке текста.
  
  Урезанный фрагмент из "вахтенного журнала" 2003 года
  периода поиска по теме "гравицапа".
  Обратите внимание как менялась точка зрения/позиция автора
  при "столкновении" с действительно "неведомым".
  //////// Опять получается немного "длинновато",
  //////// так что кому не интересно, может перейти к следующему разделу.
  //////////// Специально даю "как есть", ничего "не причесывая",
  //////////// все-таки "вахтенный журнал" это какой-никакой, но документ,
  //////////// и отношение к нему должно быть уважительное.
  //////////// Только отметил две ключевые точки в этом фрагменте,
  //////////// и указал источник.
  
  Начало цитирования.
  
  // 16.05.2003 Очередная внутренняя рецензия.
  // На предмет поиска какого-то закона сохранения.
  http://pobisk.narod.ru/Pr-ob-ch/t1.htm
  
  //////////// Государственный научный центр Российской Федерации ВНИИгеосистем
  //////////// Международный университет природы, общества и человека <Дубна>
  
  //////////// Система
  //////////// ПРИРОДА-ОБЩЕСТВО-ЧЕЛОВЕК
  //////////// УСТОЙЧИВОЕ РАЗВИТИЕ
  
  //////////// О. Л. Кузнецов, П. Г. Кузнецов, Б. Е. Большаков
  
  //////////// Дубна, 2000
  
  ......
  
  Глава 3
  
  ФИЗИКА КАК НАУКА О МАТЕРИАЛЬНОМ МИРЕ
  // А так ли это?
  
  Общие законы природы должны быть выражены
  через уравнения, справедливые во всех допустимых
  координатных системах.
   А.Эйнштейн
  // Как минимум 4 (четыре) аксиоматические дефиниции, помимо самой "природы":
  // "законы", "уравнения", "координатные системы" и "выражены".
  // Самое странное в этом эпиграфе, заключается в том, что из него по
  // законам формальной логики, следует что физика на самом деле,
  // по мнению автора, это наука НЕ о "материальном мире",
  // а "наука" манипулирования уравнениями и координатными системами,
  // для получения чего-то называемыми "законами природы".
  // Учитывая не очень высокую "результативность" этого манипулирования,
  // см. материалы о кризисе физики, наверное стоит разобраться в причинах
  // этого, НЕ ИСКЛЮЧАЯ априори из списка "подозреываемых" ни одну из этих
  // аксиоматических дефиниций. Т.е. в "длинный список" входит ВСЕ.
  // Теперь начнем формировать "короткий список".
  // Судя по содержанию материала, автор предлагает поставить в верхнюю
  // строчку "короткого списка" "координаты".
  
  Формулы, к которым мы приходим, должны быть
  такими, чтобы представитель любого народа, подставляя
  вместо символов численные значения величин, измеренные
  в его национальных единицах, получил бы верный результат.
   Дж.К.Максвелл
  // Так еще несколько аксиоматических дефиниций, нет не формулы,
  // это уже было под термином "уравнения", а составные части формулы,
  // и в первую очередь эти самые "символы", во вторых сами "численные значения",
  // ну а в третьих, то что в этом эпиграфе отсутствует, но неявно
  // подразумевается. Порядок и скажем "знак" величин этих "значений".
  // Ведь неявно тут подразумевается что уравнения должны быть "справедливы"
  // для ЛЮБЫХ возможных значений от нуля до бесконечности, и даже минус
  // беконечности. А в некоторых случаях еще и в "комлЕксном" виде.
  // Не зависимо от того можно ли такое ВООБЩЕ "измерить" хоть в каких-то
  // "единицах", а не только "национальных".
  // Наверное, надо и еще больше расширить "круг подозреваемых".
  // Это в первую очередь "измерения", это, кстати, уже не ново,
  // кое-какие "разделы физики" даже специальные "законы-постулаты"
  // для этих самых "измерений" уже успели наплодить. Хотелось бы знать
  // ТОЧНО - это тоже часть "науки о материальном мире" или все-таки
  // что-то другое.
  // Ну и наконец, правда, боюсь это еще далеко не последние "подозреваемые",
  // просто последние в этом абзаце, это сама дефиниция "числа/величины",
  // и ее "партайгеноссе", дефиниции "единица" и способ выражения
  // "числа/величины" через "единицы". Тут много чего "позарыто",
  // и все далеко не так просто как хотелось бы.
  // Надо бы было бы каждую строчку из уже достаточно длинного списка,
  // хотя бы кратко охарактеризовать. Но, боюсь, что "кратко" не получится,
  // и пока отложим это "увлекательное" занятие. Иначе до самого текста
  // дойдем не скоро. Хотя, возможно, хоть чуть-чуть разобравшись с ними,
  // можно было бы сильно подсократить себе работу. Ну да ладно,
  // как нибудь в другой раз. Собственно это первая попытка работы
  // в направлении, названия которому еще нет, так что некоторую
  // "небрежность" думаю "потомки простят", и может быть даже оценят,
  // что и им работа осталась. :)
  // Возможно в таких случаях надо сначала хотя бы самому себе изложить
  // эти моменты в виде отдельного текста, скажем ОБЯЗАТЕЛЬНОГО
  // "приложения A", и обязательно ДО самой "проработки" текста,
  // чтобы потом можно было сравнить исходную позицию с конечным
  // результатом.
  // Надо подумать, может так и сделаю. Только сначала чуть-чуть
  // "углублюсь" в сам текст и если почувствую, что постоянно
  // спотыкаюсь об неоходимость неоднократно прояснять каждый пункт
  // "списка подозреваемых" так и сделаю.
  
  Основные вопросы.
  Требование универсальности.
  Система пространственно-временных величин.
  Система LT как универсальный словарь базовых понятий прикладных математических
  теорий.
  Меры Пространства.
  Меры Времени.
  Стандартное изображение законов природы.
  Тензорное выражение закона природы.
  Обобщенные свойства систем LT.
  Иерархия величин.
  Энергия и мощность.
  Свободная и связная энергия.
  Температура и энтропия.
  Связь свободной энергии с потенциальной и кинетической.
  Поток свободной энергии и обобщенная машина.
  Классы систем реального мира.
  Замкнутые и открытые системы.
   (Определение замкнутой системы.
   Определение открытой системы.)
  Полная мощность.
  Полезная мощность и мощность потерь.
  Уравнение полной мощности.
  Связь мощности, энергии и энтропии.
  Различные формы энергии и мощности.
  Закон сохранения мощности.
  Равновесные и неравновесные системы.
  Диссипативные и антидиссипативные процессы.
  Устойчивость.
  Неустойчивое равновесие.
  Механизм устойчивой неравновесности.
  Механизм развития.
  Устойчивое развитие.
  Перспективы развития идей.
  // Ух какой общирный план, как же я сразу не посмотрел на общий обьем
  // материала и это только в "Главе 3", а ведь есть еще и остальные.
  // Уже даже и забыл зачем и почему "нарыл" этот тектст в Инете.
  
  1. Основные вопросы
  
   Физику можно разделить на экспериментальную и теоретическую.
  // "Разделяй и властвуй" - кто "разделил" физику раньше концов
  // уже не найти, но кто и как СЕЙЧАС "пожинает плоды" разделения?
  Экспериментальную физику прежде всего интересует:
   <Что измерять?> и <Как измерять?>
  // А вопрос "зачем измерять" ставится?
  Ключевой вопрос теоретической физики:
   <Какую физическую величину принять в качестве инварианта
   при исследовании тех или иных явлений материального мира?>
  // Длинная формулировка. Длинная и "круглая" - "прицепиться"
  // вроде даже не к чему. А вот душа "не лежит" к такого рода
  // формулировкам. Последствия от них обычно очень невеселые.
  Отсюда следует, что связующим звеном между экспериментальной
  и теоретической физикой выступает <Физическая величина>.
  // А мне почему-то казалось что "практика". Или "практическая
  // физика", то бишь прикладная, ничего общего ни с той ни
  // с другой "физикой" уже не имеет?
  Она выполняет функцию ЭТАЛОНА.
  // Итак поставлен знак равенства между "физической величиной",
  // "инвариантом" и "эталоном", что весьма и весьма спорно.
  // И это, безусловно, не во всех случаях, а только в тех,
  // где "теоретическая физика" сумеет "найти ответ" на свой
  // "ключевой вопрос". А если не сумеет, тогда как?
  // Или это как раз тот самый случай "что если факты противоречат
  // теории, то тем хуже для фактов". К примеру, тот же солитон,
  // точнее "уединенная волна", пока для него/нее не нашли
  // "инварианта", то бишь уравнения Кортеги-ДеФриза, так его
  // "отцы гидромеханики" и признавать не хотели. Ну ладно,
  // хоть спустя полсотни лет нашли хоть какой-то "инвариант".
  // Еще пару сотен лет, и найдут и "солитонный эталон".
  // А вот как насчет "порядка", в смысле "масштаба явления"?
  // Ведь уж не знаю сколько времени известно, что в нашем
  // материальном мире во МНОГИХ "явленииях материального мира",
  // то бишь вполне "реальных", "наблюдаемых" и, даже, как-то
  // измеряемых процессах, если не вообще во всех, при определенных
  // "масштабах" имеем один результат, а при других - КАЧЕСТВЕННО
  // иной, порой даже противоположный результат. Известно,
  // то известно, ни "инварианта" ни "эталона" для оценки
  // влияния этого "масштаба" как не было так и нет,
  // ни в общем случае, ни даже в большинстве частных.
  // Вот и "мучит отдача" частенько, когда результатам
  // относящихся к одному масштабу явлений, принимают решения
  // для совершенно иного масштаба.
  // Спрашивается: это какая именно "физика" ответственна,
  // за такую "недоработку" в "науке о материальном мире"?
  // Ситуация с "масштабом" далеко не тривиальна, на самом деле
  // она и, в очень большой мере, сама по себе задает достаточно
  // жесткую и ограниченную схему развития всей "физики" как науки,
  // и, что, наверное, еще серьезнее, провоцирует дальнейшее
  // бесконечное разделение/раздробление/измельчение любого
  // "отдельно взятого раздела" этой "науки".
  
  2. Требование универсальности
  
   Однако далеко не каждая величина может быть УНИВЕРСАЛЬНЫМ ЭТАЛОНОМ.
  // Очень хочется видеть четкую формулировку для "универсального эталона".
   В соответствии с требованиями Дж.Максвелла, А.Пуанкаре, Н.Бора,
  А.Эйнштейна, В.И.Вернадского, Р.Бартини физическая величина является
  универсальной тогда и только тогда, когда ясна ее связь
  с пространством и временем.
  // И все? "Лаптем по карте" сойдет или нет? Или классическое
  // "после дождичка в четверг"? :) Ладно, шучу конечно.
  // Хотя в каждой шутке есть только доля шутки.
  И тем не менее, до трактата Дж.К.Максвелла <Об электричестве и магнетизме>
  (1873) не была установлена связь размерности массы с длиной и временем,
  что и является причиной использования в качестве основных единиц
  не только длины и времени, но и массы.
  // Думаю не только по этому. Раньше неотьемлемой частью физики была
  // помимо "экспериментальной" и "теоретической" была еще и "прикладная
  // физика". И понятие "универсального эталона массы" в ней было вполне
  // естественным. Кстати, без этого эталона, хотя бы в самом начале,
  // скорее всего не было бы ни всей "существуюшей физики", ни цивилизации
  // ее породившей. :) "Универсальный эталон массы" при товарообмене
  // используется значительно чаще, чем "эталоны длины и времени".
  // Так что ДО "требований" указанного "ряда авторитетных товарищей",
  // были "требования", уж точно, не менее "авторитетных товарищей",
  // причем, ЗНАЧИТЕЛЬНО раньше, дольше и многочисленней. Ну и еще,
  // возможно, требование "здравого смысла", то бишь практичности.
  // Ну ладно, идем дальше, но эапомним этот "поворотный столб"
  // в истории "физики", Максвелл-1873, после которого "эталон массы"
  // перестал быть "необходимым".
  
  Поскольку введение размерности для МАССЫ - [L3 T-2] -
  введено Максвеллом, вместе с обозначением в виде квадратных скобок,
  то позволим себе привести отрывок из работы самого Максвелла:
  
  Дж.К.Максвелл. <Трактат об электричестве и магнетизме>
  (М.: Наука, 1989):
  // Н-да. Надо серьезно подумать, стоит ли вставлять свои
  // комментарии в "отрывок из работы САМОГО Максвелла".
  // На такой авторитет "замахнуться" еще не приходилось.
  // Надо покурить... Ладно, попробуем когда-то все равно придется
  // начинать. Но постараюсь быть предельно аккуратным.
  
  <ОБ ИЗМЕРЕНИИ ВЕЛИЧИН
  
  1. Любое выражение для какой-нибудь Величины состоит
  из двух факторов или компонент. Одним из таковых является
  наименование некоторой известной величины того же типа,
  что и величина, которую мы выражаем. Она берется в качестве
  эталона отсчета. Другим компонентом служит число, показывающее,
  сколько раз надо приложить эталон для получения требуемой
  величины. Эталонная стандартная величина называется в технике
  Единицей, а соответствующее число - Числовым Значением данной
  величины.
  // Это то что в выражении присутствует ЯВНО. Так сказать,
  // "надводная часть айсберга", а есть еще и НЕявная, так сказать,
  // "подводная" и размер ее, то бишь "количество компонент" в каждом
  // конкретном случае обычно не ясно. Известно, что, как минмум, "одна
  // компонента" - ОБЛАСТЬ ПРИМЕНИМОСТИ этой "Величины" точно присутствует.
  
  2. При построении математической системы мы считаем основные
  единицы - длины, времени и массы - заданными, а все производные
  единицы выводим из них с помощью простейших приемлемых определений.
  // Отмечаю, что Максвел четко ограничивает область применимости
  // пункта 2: "при построении математической системы", то бишь
  // при "построении систем" НЕматематических ссылка на Максвелла
  // по этому вопросу вообще-то не совсем корректна.
  
  Следовательно, во всех научных исследованиях очень важно
  использовать единицы, принадлежащие системе, должным образом
  определенной, равно как и знать их связи с основными единицами,
  чтобы иметь возможность сразу же пересчитывать результаты одной
  системы в другую.
  
  Знание размерности единиц снабжает нас способом проверки, который
  следует применять к уравнениям, полученным в результате длительных
  исследований.
  // Кстати, весьма практичный способ проверки, но почему-то сейчас
  // основательно подзабытый. Впрочем как и многие другие, например,
  // "по тенденциям", "на здравый смысл" и даже "лингвистический
  // анализ" позволяет кое-что проверить, ведь как ни крути
  // а "в Начале было Слово".
  
  Размерность каждого из членов уравнения относительно каждой
  из трех основных единиц должна быть одной и той же.
  Если это не так, то уравнение бессмысленно, оно содержит
  какую-то ошибку, поскольку его интерпретация оказывается
  разной и зависящей от той произвольной системы единиц,
  которую мы принимаем.
  
  ТРИ ОСНОВНЫЕ ЕДИНИЦЫ
  
  3. (1) ДЛИНА. Эталоном длины, используемым в нашей стране
  в научных целях, служит фут, который составляет третью часть
  стандартного ярда, хранящегося в Казначейской Палате.
  
  Во Франции и других странах, принявших метрическую систему,
  эталоном длины является метр. Теоретически это одна десятимиллионная
  часть длины земного меридиана, измеренного от полюса до экватора;
  практически же это длина хранящегося в Париже эталона,
  изготовленного Борда (Borda) с таким расчетом, чтобы при
  температуре таянья льда он соответствовал значению длины
  меридиана, полученному Даламбером. Измерения, отражающие
  новые и более точные измерения Земли, не вносятся в метр,
  наоборот, - сама дуга меридиана исчисляется в первоначальных
  метрах.
  
  В астрономии за единицу длины принимается иногда среднее
  расстояние от Земли до Солнца.
  
  При современном состоянии науки наиболее универсальным
  эталоном длины из числа тех, которые можно было бы предложить,
  служила бы длина волны света определенного вида, испускаемого
  каким-либо широко распространенным веществом (например, натрием),
  имеющим в своем спектре четко отождествляемые линии.
  Такой эталон не зависел бы от каких-либо изменений
  в размерах Земли, и его следовало бы принять тем,
  кто надеется, что их писания окажутся более долговечными,
  чем это небесное тело.
  // Похоже, что это отличный образец хорошего научного юмора
  // в совершенно строгой работе.
  // Но в каждой шутке есть только доля шутки. Ведь так и сделали.
  // Интересно, не по той ли самой причине, на которую указывал
  // сам Максвелл.
  // И еще один момент. Максвелл не знал, хотя возможно и не отрицал
  // такую возможность судя по оговорке "при современном состоянии науки",
  // что вообще-то "некоторые" спектральные линии у "некоторых" веществ,
  // могут быть и НЕпостоянные. При чем это известно уже даже
  // "при современном состоянии науки", а что будет еще лет через
  // сто-двести уже никто не знает. Возможно, в этом мире вообще
  // нет ничего постоянного.
  
  При работе с размерностями единиц мы будем обозначать
  единицу длины как [L]. Если численное значение длины
  равно l, то это понимается как значение, выраженное
  через определенную единицу [L], так что вся истинная
  длина представляется как l [L].
  
  4. (2) ВРЕМЯ. Во всех цивилизованных странах стандартная
  единица времени выводится из периода обращения Земли вокруг
  своей оси. Звездные сутки или истинный период обращения Земли
  может быть установлен с большой точностью при обычных астрономических
  наблюдениях, а средние солнечные сутки могут быть вычислены
  из звездных суток благодаря нашему знанию продолжительности года.
  // При "астрономических наблюдениях" с еще большей точностью
  // выяснилось, что и вращение Земли очень даже не постоянно,
  // и даже наблюдаются сезонные колебания в скорости вращения.
  
  Секунда среднего солнечного времени принята в качестве единицы
  времени во всех физических исследованиях.
  // Уже и эталон времени привязали к частоте какого излучения,
  // или к периоду полураспада чего-то там.
  // Возможно по той же причине, что и длину.
  
  В астрономии за единицу времени иногда берется год.
  Более универсальную единицу времени можно было бы установить,
  взяв период колебаний того самого света, длина волны которого
  равна единице длины.
  // Ага это он тоже превидел.
  
  Мы будем именовать конкретную единицу времени как [T],
  а числовую меру времени обозначать через t.
  
  5. (3) МАССА. В нашей стране стандартной единицей массы является
  эталонный коммерческий фунт (avoirdupois pound), хранящийся
  в Казначейской Палате. Часто используемый в качестве единицы
  гран (grain) составляет одну 7000-ю долю этого фунта.
  
  В метрической системе единицей массы служит грамм; теоретически
  это масса кубического сантиметра дистиллированной воды при
  стандартных значениях температуры и давления, а практически
  это одна тысячная часть эталонного килограмма, хранящегося в Париже*.
  
  Но если, как это делается во французской системе, определенное вещество,
  а именно вода, берется в качестве эталона плотности, то единица массы
  уже перестает быть независимой, а изменяется подобно единице объема,
  т.е. как [L3]. Если же, как в астрономической системе,
  единица массы выражена через силу ее притяжения, то размерность [M]
  оказывается такой [L3 T-2]>.
  // Здесь похоже "первоисточник" заканчивается, и можно
  // перейти из положения "смирно" в состояние "вольно". :)
  // Максвелл почему-то забыл упомянуть, что вообще-то в физике
  // обычно различают ДВЕ РАЗЛИЧНЫЕ "массы" - инерционную и гравитационную
  // отражающие два принципиально разных свойства материальных тел,
  // инерцию и гравитацию. И очень большое количество работ, причем
  // экспериментальных, было посвящено проверке их "идентичности".
  // И "эталон массы" как раз и служит, свзующим звеном между этими
  // противоречивыми, и теоретически никак не сводимыми одно
  // к другому свойствами. А без такого "сведения" операции с размерностью
  // массы с использованием ТОЛЬКО "силы ее притяжения" на самом деле
  // могут быть, вот уж точно, "половинчатыми" и "неполными".
  
  Максвелл показывает, что массу можно исключить из числа основных
  понятия <сила>:
  
   1) F=y*(M1*M2)/R*R и 2) F=M*g
  
   Приравнивая эти два выражения и считая гравитационную
  постоянную безразмерной величиной, Максвелл получает:
  
   M*g=y*(M1*M2)/R*R , [M] = [L3 T-2].
  
   Масса оказалась пространственно-временной величиной.
  Ее размерность: объем с угловым ускорением (или плотностью,
  имеющей ту же размерность ).
  // Ну что ж, надо разбираться. Математической эквилибристикой
  // вообще-то много чего можно "начудить". Но тут особый случай.
  // Тут нет грубых ошибок, все много раз проверено, но проверено
  // "по размерности", а вот другие типы проверок похоже не применяли.
  // Ну к этим формулам вернемся попозже. Сначала несколько
  // соображений "общего порядка". Сначала процитирую самого
  // Максвелла из приведенного же отрывка, то место где он
  // говорит о проверке "по размерностям", "по образу и подобию"
  // которой и сделано это "обрезание" эталона массы. Читаем еще раз:
  // "Размерность каждого из членов уравнения относительно каждой
  // из трех основных единиц должна быть одной и той же.
  // Если это не так, то уравнение бессмысленно, оно содержит
  // какую-то ошибку, поскольку его интерпретация оказывается
  // разной и зависящей от той произвольной системы единиц,
  // которую мы принимаем."
  // Ну, и что это означает эта проверка "по факту"?
  // Ну неужели уже этого никто не помнит.
  // Это ведь проверка на ОБНАРУЖЕНИЕ грубой ошибки, то бишь
  // всего лишь необходимое, но далеко НЕ достаточное условие
  // правильности, и тем более осмысленности "уравнения".
  // Эта проверка никоим образом не гарантирует, что "уравнение"
  // имеет хоть какой-то смысл. Потому как "уравнение" может
  // содержать и ДРУГИЕ виды ошибок, кроме ошибок несоизмеримости.
  // Надеюсь, что все-таки хоть кто-то еще об этом помнит, а то
  // как-то совсем грустно стало. Наверное просто пора спать.
  //
  // Спустя несколько дней.
  // Что-то поубавилось желание спорить с выводом о том,
  // что "масса оказалась пространственно-временной величиной".
  // Не потому, что контраргументы "полегчали", наоборот,
  // совсем нет, просто похоже здесь этот заочный спор немного
  // не к месту. Это больше вопрос о "гравитации" и спорить
  // уже надо не самим Максвелом, а уже с САМИМ Ньютоном.
  // Исходная формула, используемая для "обрезания массы",
  // скажем мягко, требует дополнительного анализа.
  // Но если этим заняться, до самой статьи дело
  // дойдет ой как нескоро.
  // Поэтому, оставаясь при собственном мнении относительно "массы",
  // согласимся на время с авторами статьи, оставляя за собой право,
  // кое-где поехидничать.
  // Хотя одно замечание все же стоит сделать. Учитывая, что
  // единицы времени и длины могут выражаться через излучение
  // какого-то конкретного вещества, реально обладающего массой,
  // то пользуясь точно такой же математической эквилибристикой
  // можно получить "производные" выражения для всех единиц измерения
  // не только в "системе" LT(длина-время), но и MT (масса-время)
  // и даже ML(масса-длина). И тогда в зависимости от вкусов
  // "эквилибриста" может и пространство оказаться "массово-временной"
  // величиной, и время - "массово-пространственной".
  // Но это так, к сведению любителей "абсолютной строгости".
  
  Величина массы стала удовлетворять требованию универсальности.
  // А вот требованиям здравого смысла ПЕРЕСТАЛА удовлетворять.
  // Еще одно свидетельство, что понимание того, что означает
  // "проверка по размерностям" похоже утеряно.
  // Вывод, что "ее размерность: объем с угловым ускорением"
  // кроме всего прочего означает, что если обьем "закручивать с ускорением",
  // то должна "возникнуть" масса. Это, очевидно, если внимательно
  // читать "пункт 2" из приведенной цитаты. И, наоборот, масса есть
  // обьем "закручивающийся с ускорением" и здесь уже вовсю "возмущается"
  // "проверка по тенденциям". Конкретная массивное тело может реально
  // существовать ОЧЕНЬ долго, и тогда вопрос: до какой угловой скорости
  // может "закрутиться соотвествующее пространство" с каким угодно
  // малым "начальным ускорением"? Вобщем в данном случае
  // требования "универсальности" и "здравого смысла", как минимум,
  // требуют согласования. Ну да ладно, поехидничали и хватит.
  // Попробуем пройти дальше.
  Появилась возможность выразить все другие физические величины
  в пространственно-временных единицах измерения.
  // Лучше бы в единицах "здравого смысла"
  
  Так выглядел результат в 1873 г., а еще раньше в 1716 г.
  к такой возможности пришел Герман, в так называемой Форономии.
  // Но к этому НЕЛЬЗЯ было придти до "открытия гравитации" Ньютоном.
  // Следовательно, Ньютон либо не увидел такой "возможности",
  // либо, наоборот, именно такая "возможность" трактовки его
  // работы его и смущала аж двадцать лет, в течении которых
  // он не решался ее опубликовать. Насколько помнится Ньютон
  // сам был не очень доволен тем, КАК были им введены в "научный
  // оборот" гравитационные свойства материальных тел,
  // хотя предложенная им формула давала "неплохие" результаты.
  
  3. Система пространственно-временных величин
  В 1965 г. в Докладах АН СССР ?4 была опубликована статья Р.Бартини
  <Кинематическая система физических величин>.
  // Ага вот теперь вспомнил как наткнулся на этот текст -
  // искал работы Бартини.
  Эти результаты - малоизвестные, но имеют исключительно
  важное значение для обсуждаемой проблемы.
  В 1973 г. Р.Бартини показывал нам пожелтевший от времени
  лист бумаги с таблицей, написанной им в 1936-1937 гг.
  В этой таблице он установил пространственно-временную
  размерность любой физической величины и использовал
  ее для проверки аналитических выкладок.
  // Стоп. Не надо путать "боб с горохом".
  // Ведь ясно же сказано "для проверки аналитических выкладок".
  // А это совсем другой "коленкор". Для этой цели ЕДИНООБРАЗНОЕ
  // представление различных физических величин ВЕСЬМА ПРАКТИЧНО,
  // что только добавляет моего уважения к Бартини. Тем более это
  // имеет смысл еще и потому, что во всех этих "аналитических
  // выкладках" ОЦЕНКА гравитационных свойств тел осуществлялась
  // на основе ОДНОЙ и ТОЙ же формулы, той самой, что предложена
  // Ньютоном. Но вот делать на основании такого рода "рацпредложений",
  // уменьшающих обьем рутинных операций по манипуляции с виртуальными
  // обьектами, теми самыми аналитическими выражениями, выводы
  // о СУЩНОСТНОЙ природе МАТЕРИАЛЬНОГО МИРА, мягко скажем, надо делать
  // с осторожностью. И одними ссылками на авторитеты тут не обойдешься.
  К аналогичному результату, но в 1967 г., пришел академик Е.Седов,
  а в 1969 г. - академики Л.Ландау и Е.Лифшиц.
  // Вспомнить бы чем и когда отличились указанные товарищи, и попытаться
  // понять насколько продуктивным для них оказался такой "результат".
  В системе пространственно-временных величин размерность любой
  физической величины выражается ЦЕЛЫМИ (положительными или отрицательными)
  ЧИСЛАМИ. Здесь нет дробных степеней, которые лишают сам анализ
  размерности его прикладного значения (рис. 3.1).
  // "Целые числа" набраны большими буквами не мной, а авторами.
  // Почему-то по их мнению это критически важно.
  // А мне это непонятно, это ведь все-таки не нумерология.
  // И надо подумать почему это "дробные степени лишают анализ
  // размерности его ПРИКЛАДНОГО значения"? В моем понимании,
  // как раз "прикладному" аспекту анализа это точно "по барабану".
  // Наверно по-разному понимается дефиниция "прикладной". :(
  // Или здесь понимается проверка на "здравый смысл", но тогда
  // почему здесь это важно, а в исходном пункте, при манипуляции
  // с массой "здравый смысл", скажем мягко, где-то на задних ролях.
  
   ...
  
  Рис. 3.1. Система пространственно-временных величин
  
  4. Система LT как универсальный словарь базовых понятий
  прикладных математических теорий
  // Так прикладные математические теории есть, а о прикладных
  // физических опять забыли упомянуть. А текст вроде как о физике.
  
  Система оказалась универсальным словарем понятий для всех
  прикладных математических теорий. Это тот словарь, отсутствие
  которого заводит в тупик при попытке сконструировать формальную
  математическую теорию без использования физически измеримых величин.
  // А с этим словарем, значит есть надежда на конструирование
  // "формальной математической теории без использования физически
  // измеримых величин". И для чего же будет "предназначена" такая
  // с позволения сказать "теория" если с "физическими величинами"
  // у нее не остается никакой связи? Вобщем, этого абзаца я не понял.
  
  Хотя система универсальных величин весьма <проста> -
  это только <видимость>. В настоящее время в работах физиков теоретиков
  по общей теории относительности используются еще <более простые> системы,
  построенные на одной размерной величине.
  // Ну вот оказывается, что можно и дальше "сворачивать"
  // "универсальные эталоны". И плевать этим теоретикам, что там считали
  // упомянутые "авторитетные товарищи".
  Так, например, Дж.Уилер использует одну величину - длину [L],
  а Дж.Синг - только время [T].
  // А "массу" никто не пробовал использовать? Я серьезно спрашиваю.
  // Неужели же действительно никто в этой "науке о материальном мире"
  // даже не пытался что то построить используя "величину" связанную
  // с "материей" безо всяческих "преобразований"?
  // Уже даже совсем и не смешно.
  Однако там возникают проблемы дробных степеней.
  // Интересно в чем собственно проблема.
  
  По отношению к этим конструкциям система из двух единиц -
  длины [L] и времени [T] - может считаться не очень <экономной>.
  Однако, хотя основных величин в системе только две, они имеют
  векторный характер, т.е. каждая из них имеет три орты.
  // Ну вот это как раз и есть переход от манипуляций с формулами
  // и размерностями к манипуляциям с сущностями.
  // Откуда собственно взялось у времени "три орты". За такое
  // "манипулирование" в приличных местах обычно можно и
  // "канделябром схлопотать". Но видимо это очень НЕприличное
  // место. Надо бы не забыть как оно называется.
  
  Они обозначаются: [Lx] [Ly] [Lz] - для ориентированных длин и
   [Tx] [Ty] [Tz] - для ориентированных времен.
  
  <Элементарный (3 + 3)-мерный образ можно рассматривать
  как волну и как вращающийся осциллятор, попеременно
  являющийся стоком и источником, образованным сингулярностью
  преобразований. В осцилляторе происходит поляризация компонентов
  фона, преобразование L R T или T R L в зависимости от ориентации
  осциллятора, создающего ветвление L- и Т-протяженностей.
  Элементарный осциллятор является зарядом, создающим вокруг себя
  и внутри себя поле> (Р.Бартини).
  // Блин. Если бы не автор фрагмента, то выматерился бы на всю
  // катушку. А так надо разбираться. Честное слово, попытаюсь
  // разобраться, но не здесь. Пока пропускаем. Ух какой же я злой.
  // Точнее не злой, а скорее ОЧЕНЬ сильно озадаченный.
  // Такое ощущение, что перед тобой не текст, а ... шифрограмма,
  // смысл, которой тебе возможно никогда не будет понятен.
  
  ///////// !!! Вот он КЛЮЧЕВОЙ момент в этом фрагменте !!!
  
  // Не могу поверить, что Бартини на старости лет начал играть в эти
  // теоретико-математические развлечения академиков, в надежде
  // донести до "высоколобых" какую-то истину, и тем более способ
  // "проверки аналитических выкладок" - абсолютно бесполезное
  // "рацпредложение" в эпоху все побеждащих цифровых компьютеров.
  // А вот "коперниковскую шутку" сыграть с ними мог.
  // Ну не мог ТАКОЙ авиаконструктор рано или поздно начать
  // "разбираться" с гравитацией, при этом отлично зная,
  // по собственному опыту, что сделает официальная наука
  // с любой попыткой даже не посягнуть, а просто задеть
  // эту "священную гравитационную корову", как впрочем и
  // любую другую. Зная об "удивительных" исчезновениях архивов
  // того же Николы Тесла, или даже САМОГО "канонизированного"
  // Эйнштейна... Зная что времени у него осталось немного...
  // Следовательно, либо Бартини впал в маразм,
  // с этой своей "Кинематической системой физических величин",
  // строя фундамент "формальной математической теории без
  // использования физически измеримых величин",
  // либо ... в очередной раз опередил время.
  // Блин, ну почему я такой тупой.
  // Ну ничего не понимаю кроме того, что "вращающийся осциллятор,
  // попеременно являющийся стоком и источником" это, возможно,
  // какое-то ЯВНОЕ указание на ИНЕРЦИОННУЮ массу, да еще, похоже,
  // УВЯЗАННУЮ с массой ГРАВИТАЦИОННОЙ, этот самый "сток-исток".
  // Или ключик в том, что "элементарный осциллятор является зарядом,
  // создающим вокруг себя и ВНУТРИ себя поле". То есть внутри ТОЧКИ?
  // Бред какой-то. И при этом этот "бред" прошел через все
  // академические "фильтры" и "барьеры" и теперь цитируется ДОСЛОВНО.
  // Блин, ну почему я такой тупой...
  // Так первая, самая беглая проверка этой гипотезы, только добавило
  // ощущение что здесь действительно шифрованный "рекбус-кроксворд"
  // Что стало известно:
  // - был уже запущен и первый спутник и первый космонавт;
  // - именно в этот период с подачи Хрущева, развитие авиации было
  // приторможено в пользу космонавтики;
  // - что эта "система кординат" оценивалась самим Бартини
  // как "дело всей жизни";
  // - он чуть "не сходил с ума" от невозможности ее опубликовать;
  // - статья была написана не позднее 1962 года, и непубликовалась
  // как минимум два-три года, несмотря на всевозможные протекции;
  // - похоже сам Бартини эту статью после публикации никак
  // не комментировал, хотя и выступал по теме статьи;
  // - обещанной следующей статьи об "экспериментальном доказательстве"
  // "шестимерности мира" вроде как вообще не было;
  // - опубликована она была "по блату" молодым-неопытным академиком;
  // - работа стала соответствовать "модным веяниям" в науке только
  // в последнее десятилетие;
  // - статья подверглась какой-то коррекции;
  // - статья первоначально была об "уникальном и эталонном обьекте"
  // по факту, являющемся Вселенной;
  // - считается, что статья посвящена "шестимерности" нашего
  // мира и должна подсказать путь для путешествий во времени;
  // - в различных источниках материал статьи цитируется в основном
  // фразами из этого же фрагмента;
  // Вобщем, ни одного намека ПРОТИВОРЕЧАЩЕГО тому, что здесь
  // имеет место "коперниковская шутка" человека всю свою жизнь
  // посвятившего борьбе с "притяжением земли". :)
  // Фиксируем дату (23.05.2003 21:28)
  // Будем считать это точкой отсчета "внутреннего раследования"
  // на предмет поиска ключа к "завещанию Бартини".
  /// А вот и еще одно соображение на ту тему.
  /// На всех уфошных сайтах упоминаются "летающие тарелки"
  /// "третьего рейха". Мол была у них "антигравы". Может быть
  /// и были, реактивные авиацию они точно успели сделать,
  /// Вот только один вопросик напрашивается, а что "штандартенфюреры
  /// Штирлицы" гитлеровскую "гравицапу" проспали. Про Пенемюнде знали,
  /// про "урановый проект" тоже, про всякое новое "чудо-оружие" тоже,
  /// а про "гравицапу" нет? И то при том, что люфтваффе куда "плотнее"
  /// опекалась советской разведкой, чем ядерная физика. А если знали
  /// то какие ответные действия прдпринимались? Если судить по
  /// реактивным самолетам и урановым проектам, то не позднее 1942-43 года,
  /// должны были начать разработку "ассиметричного ответа".
  /// И кто в том случае мог оказаться среди конструкторов, абсолютно
  /// безумной идеи? А тот кто закончил предыдущий проект в том 1942-43
  /// году, был знаком с "основами физики" несколько глубже обычных
  /// авиаконструкторов, был достаточно безумен, чтобы такое реализовать,
  /// и по "каким-то" причинам имел более серьезный допуск к секретным
  /// проектам. Хотя тогда пожалуй все было секретно,
  /// Так вот похоже по всем параметрам в число консрукторов
  /// "советской гравицапы", если такой проект был в 1943-44 годах,
  /// ДОЛЖЕН был попасть Бартини. У него как раз закончился проект
  /// РЕАКТИВНОГО перехватчика, то бишь "нашего ответа" на гитлеровскую
  /// "реактивную программу", он ранее учавствовал в других секретных проектах,
  /// тот же самолет-невидимка, ОЧЕНЬ неплохо по-видимому ЗНАЛ физику и
  /// физиков, ну и попутно "мотал срок".
  /// То бишь вполне приемлемый кандидат в такой проект.
  /// Потому то что группу Туполева освободили, а его нет, и он это
  /// так и предполагал, вполне возможно обьясняется не происками
  /// спецслужб лично против него, а участием в каком-то "несовсем"
  /// обычном проекте. Вобщем надо будет проверить по датам и такой
  /// вариант. Хотя о "сталинско-бериевских гравицапах" никаких
  /// упоминаний слышать не приходилось.
  
  На такую же возможность (3 + 3)-мерного представления L и Т
  обращал внимание еще Ханкеле.
  // Этого не знаю. Так что спокойно идем дальше.
  
  Если отбросить на время фиксированные индексы ориентации,
  // Ох как хочется и еще чего-то "отбросить", хорошо хоть не "копыта".
  то любая физическая величина представляется <брутто-формулой>:
  
   [L**R T**S] , (3.1)
  
  где R и S - ЦЕЛЫЕ (положительные и отрицательные) ЧИСЛА.
  
  Все физически измеряемые величины выводятся из двух основных
  и представляются в виде произведения целочисленных степеней
  длины и времени . При различных R и S имеем: безразмерные константы ,
  объекты геометрии , <временные> (в частности, частотно-временные) .
  Соединение <пространственных> и <временных> величин дает словарь
  универсальных понятий.
  
  5. Меры Пространства
  Если положить S = 0, то формула примет вид [L**R] .
  
  То есть после исключения понятия ВРЕМЯ, мы приходим к системе
  величин А.Лебега. Действительно: [L**1] = длина; [L**2] = площадь; [L**3]= объем;
  = тор; [L**R] = гипертор R-го порядка.
  
  Считая размерную величину [L**1] = длина - константой, как принято
  выражаться у Н.Бурбаки, явной аксиомой, мы получим понятие
  абсолютно твердое тело, имеющее колоссальное значение для
  <обоснования математики>. При переходе в другую область,
  например, в гидродинамику, нам придется заменить явную аксиому
  
   [L**1]= const
  
  на другую явную аксиому:
  
   [L**3]= const.
  
  В новой <системе тел> по А.Лебегу <расстояние> между точками
  по-прежнему будет числом, но не будет <величиной> относительно <объема>.
  
  Но, если мы изучаем вращение свободных тел, то нам нужно рассмотреть
  произведение радиуса вращения на угловую скорость. Как известно,
  это произведение есть функция постоянная для всех тел, независимо
  от их размеров. Имеем:
  
   [L**1 T**-1]= const.
  
  Здесь появляется время.
  
  Если положить R = 0, то формула (1) принимает вид:
  
   [L**0 T**1]= [T**1],
  
  то есть после исключения понятия длина, мы получаем систему
  понятий, описывающих ВРЕМЯ.
  
  6. Меры Времени
  
  При S > 0 имеем пространственные меры времени:
  [T**1] - период;
  [T**2] - поверхность времени;
  [T**3] - объем времени.
  
  При S < 0 - частотные меры времени:
  [T**-1] - частота;
  [T**-2] - угловое ускорение;
  [T**-3] - гиперчастота S-порядка.
  // Пока не забыл. Пробегаясь по материалам связанных с Бартини.
  // Споткнулся о слово типа "комплексный угол" или "мнимое угловое
  // ускорение" точно не помню, но зацепила сама мысль что надо
  // проверить чисто "на слух" и "на смех" возможность "комплексных"
  // или "мнимых" значений для величин, параметров, которые ну никак
  // "в здравом уме" могут быть "мнимыми" или с какой-то там "комплексной
  // частью". И вообще, может наконец пришла пора как-то для себя разобраться
  // что же все-таки означает комплексная часть.
  
  ////////// !!! А это уже второй КЛЮЧЕВОЙ момент !!!,
  ////////// но который в тот момент подзабылся под влиянием "шифрограммы"
  ////////// и снова возник уже спустя много лет,
  ////////// когда прорабатывал работы Роджера Пенроуза,
  ////////// и родилась новая увлекательная тема поиска "iмагическое".
  ////////// Но сколько времени и мыслей было упущено.
  
  ......
  
  Конец цитирования
  
  =========
  
  25.02.2023 12:29
  
  Использование ИИ-инструментов.
  В оглавление.
  
  Использование инструментов с элементами ИИ пока, естественно, ограничено,
  но уже вполне может приносить определенные результаты.
  Даже с учетом всех ограничений, которые они достаточно явно демонстрируют,
  правда пока непонятно, то ли по причине "врожденной" ограниченности,
  то ли по причине наложенной на них "редакционной политики",
  кое-что можно сделать уже сейчас.
  а тем более в уже не таком и далеком будущем.
  
  =========
  
  Во-первых, это проверка каких-то фактов/информации/гипотез
  по значительно более широкой базе, чем реально доступной одному человеку
  даже на протяжении всей его жизни. Это вроде уже понятно всем,
  и даже закрепилось в виде термина "погуглить",
  как реакция на девиз Гугла "Найдется все".
  Тут вроде и добавить особо нечего,
  но кое-что, на мой взгляд, немаловажное все же можно.
  
  Тут надо разделять постановку запроса к поисковику и анализ результатов поиска.
  
  Сначала о результатах, т.к. собственно ради них и делался поиск.
  Вроде общепризнанно, что чем точнее задать "параметры поиска" тем более
  точным/нужным будет результат. Но это не совсем так, в общем случае.
  
  Тут нужно понимать, что "поисковики" это не продукт "альтруизма"
  их создателей, а вполне определенный коммерческий и "не только"
  коммерческий (и об этом никогда не стоит забывать) проект со своими целями
  и достаточно непубличной "редакционной политикой", и соответственно
  к этому относится.
  Тут, наверно, стоит вспомнить Ницше "Если Вы долго всматриваетесь в Бездну,
  то и Бездна начинает всматриваться в Вас".
  
  Первое это нужно оценить количество выдаваемых результатов поиска
  - это пока еще в ответе на запрос фигурирует в отчете -
  но это цифра только оценочная, показывающая степень настройки запроса.
  Может быть эти показатели со временем как-то улучшат/дифференцируют,
  но сильно на это надеяться не приходится, так как тенденция
  пока скорее обратная. Раньше у Гугла был показатель
  "Количество аналогичных запросов за месяц"
  - очень информативный на самом деле показатель -
  но сейчас от него "почему-то" отказались, зато добавили
  "время реализации запроса", на мой взгляд, чисто рекламная "фишка",
  потому как так и не смог хоть как-то его приспособить к делу.
  
  Но даже по такой приближенной оценке количества результатов,
  из которых большая часть, скорее всего очень далека от того,
  что ищется можно сделать какие-то выводы.
  Если результатов мало, то можно рассчитывать,
  что то что Вы ищете, располагается на первых двух-трех страницах,
  Если же результатов больше сотни, как это обычно бывает,
  то результаты, скорее всего, располагаются по следующей схеме
  (во всяком случае у Гугла так), сначала наиболее "распиаренные"
  и чаще всего "посещаемые" (та же Вики), затем что-то
  "коммерческое", т.е. "приплатившее" за топ-позицию в списке,
  и только на второй или третьей странице поиска,
  действительно что-то интересное, или вообще наиболее точно
  соответствующее запросу. Вот только вчера имел подобный прецедент,
  ввел название книги, но полное совпадение нашлось только на второй странице
  результатов поиска.
  
  Так что при использовании поисковиков нужно учиться
  "фильтровать гугл-базар".
  Простым уточнением запроса это не исправляется и "не лечится".
  
  Кстати, то, что выпадает в таких случаях на второй-третьей
  странице поиска, иногда оказывается даже более интересным
  чем собственно то, что пытался отыскать в исходном запросе,
  так как там фактически проявляется определенная "ассоциативность"
  или "нечеткость" поиска по ключевым словам,
  на которых во многом построены поисковые системы.
  Т.е. в этих результатах можно углядеть или какой-то косвенно, или
  не очень явно связанный с темой запроса материал
  - ну просто не знал точно где это еще встречается -
  либо вообще новое для себя направление поиска.
  
  Теперь собственно составление запроса/ключа поиска.
  Рекомендаций по уточнению запроса повторять не буду - их и так достаточно.
  Отмечу только особую эффективность, но правда не всегда,
  "парадоксальных" запросов, т.е фраз, комбинаций/сочетаний слов
  с неожиданным/противоречивым/фантастическим смыслом/трактовкой.
  Как раз у поисковиков это проходит "на ура", именно
  из-за их принципам работы в основном по ключевым словам.
  
  Собственно для такого рода запросов и стоит при анализе
  материала и фиксировать собственные вопросы/мысли/фразы,
  удачные и неудачные, чтобы "прокачать" их поисковике
  на предмет "созвучия" или, наоборот, "диссонанса"
  с "коллективным разумом Инета".
  
  =======
  
  Во-вторых, это попытка проверки тех или иных мыслей/гипотез
  или даже поиска ответа на конкретный вопрос в чат-ботах типа ChatGPT
  вместо изнуряющего поиска в соответствующей литературе.
  Такое сейчас уже возможно, правда пока в тестовом режиме.
  См, например, "А это, детектив, правильный вопрос"
  автор Sbodrenko
  https://habr.com/ru/post/718718/
  
  Тут важно понимать, что эти технологии совершенствуются
  и так или иначе будут применяться.
  И основное тут, в каком направление пойдет их совершенствование
  и "юзабилити". Понятно, что в сторону и расширения базы знаний,
  и совершенствования алгоритмов, в том числе совершенствования
  языковых средств, но главное это скорее, все-таки,
  в настройке на конкретного пользователя.
  Из меня пророк, конечно, никакой, но представляется,
  что направление "персонального секретаря/ассистента/референта/эксперта"
  все-таки будет развиваться. И учитывая, что в основе этих ИИ
  лежат модели "обучения" по каким-то корпусам текстов,
  можно предположить, что такая настройка на конкретного
  пользоваться проще всего будет реализована,
  как набор вида "воздействие-реакция", может быть в форме "запрос-ответ",
  а может в виде "фрагментов дневников", отражающих
  реакцию конкретного пользователя на конкретный текст.
  
  И в таком ключе вариант ведения "вахтенного журнала" более
  предпочтительнее чем ведение "базы знаний",
  так как позволяет не только проводить поэтапное обучение,
  но и последовательную проверку соответствия реакции
  "персонального ассистента" на каждую последующую "вводную",
  и в соответствии с ним вносить коррективы в процесс обучения.
  Наверно это еще будет не скоро, а может быть уже в течении
  ближайшего десятилетия. Тут трудно загадывать.
  Но если это все-таки "время прекрасное" наступит
  то "вахтенные журналы" собственных исканий и находок
  будут очень кстати.
  
  Ну и на совсем дальнюю перспективу, мне кажется,
  что "искусственную личность" легче "воссоздать"
  не по сборке "фотографий любимых котиков",
  а по зафиксированному процессу обработки текстовой информации,
  который так или иначе отражен в "вахтенном журнале".
  Но это повторюсь, на самом деле очень далекая перспектива.
  Но если уже сейчас есть ИИ-художники достаточно
  близко воспроизводящие манеру тех или иных мастеров,
  то почему не ожидать, что у текстовых ИИ,
  не появится возможность дообучения под конкретный
  "авторский стиль"?
  Причем не по формальным "чисто лексическим" признакам,
  но и по каким-то более принципиальным моментам.
  
  =========
  
  В-третьих, это совершенно новое направление,
  вроде не очень связанное с "текстом" - ИИ-художники.
  Но это как на это дело посмотреть.
  
  Чтобы ввести в курс дела предлагаю посмотреть
  в качестве информации к размышлению статьи
  "ИИ-художник от Сбербанка - хотели как лучше. А как получилось?"
  автор Olvik
  https://aftershock.news/?q=node/1214294
  и "Анализ гуманитария - чайник тестирует Миджорни"
  автор Karver
  https://aftershock.news/?q=node/1214975
  а качестве иллюстрации
  "Как выглядит долбоящер"
  разместил: Око Политика
  https://oko-planet.su/politik/politiklist/695176-kak-vygljadit-dolbojascher.html
  
  Для тех, кому лень ходить по ссылкам попытаюсь сформулировать своими словами.
  начнем с разбора подзаголовка -
  "Heйросеть пpeвpaтилa знaмeнитые pyccкиe пocлoвицы в иллюcтpaции".
  Т.е. ИИ-художник - это всю та же нейросеть, которая специально обучается
  на сопоставлении пар <текст - изображение>. Причем таких пар при обучении
  используются миллиарды штук. При этом используются алгоритмы обучения,
  как ищущее что-то общее, так и выделяющие определенные отличия,
  например, типа привязки к отдельным словам/стилям/авторам.
  И на базе построенной модели знаний/образцов генерить новые изображения
  по текстовому запросу с учетом каких-то дополнительных наложенных условий,
  типа стиля, автора или временной эпохи.
  Одна из целей такого рода систем:
  "В любой момент создавать необходимое количество
  licence-free иллюстраций в неограниченном объеме".
  
  Что-то уже получается, что-то еще нет, типа "ощущения вторичности",
  недостаточная "проработка деталей" и т.п. Но это не так важно,
  важно что процесс идет. Еще пяток лет назад
  это было на уровне "детских раскрасок", а сейчас уже профессиональные
  художники не на шутку забеспокоились о том что "хулиганы зрения лишают".
  И это ведь это еще далеко не предел.
  
  И хотя у авторов указанных выше обзоров сложилось мнение,
  что это чистый "попил" выделенных средств, но это их личное мнение,
  так как, скорее всего, что смотрят они на известные недостатки,
  и не замечают других новых возможностей.
  
  Какое же это имеет отношение к "тексту" тем более к результатам
  работы с "текстом" систем "генеративных художников"?
  
  А здесь помимо чисто утилитарных целей - создания иллюстраций к тексту,
  что наверно для авторов СамИздата достаточно актуально,
  стоит обратить внимание на такое направление, реализуемое этими системами
  как "Visual Art - источник визуальных концепций,
  соединений различных признаков и абстракций".
  
  Т.е. попытаться те же самые "ключевые" вопросы/мысли/гипотезы/фразы
  которые используются для запросов к поисковой системе представить
  в виде "визуальных образов". Тут двоякая цель, помимо самих по себе
  "оригинальных картинок", получить какое-то кОмплексный ВИЗУАЛЬНЫЙ образ
  своих "тестовых измышлизмов" и связанных с ним объективных/распространенных
  "визуальных ассоциаций", что тоже само по себе бывает полезно.
  
  С одной стороны, это дает этакую "этическую" и "эстетическую" оценку
  используемого текстовой фразы с общеупотребительной точки зрения,
  так как база знаний ИИ-художника основывается на привычных "данных",
  А это тоже немаловажно и иногда может служить
  для выбора того или иного варианта, например, названия всего текста
  или каких-то разделов/глав или "действующих лиц".
  
  А во-вторых, и это, наверно, куда важнее в плане развития
  "многомерного мышления" - добавляется еще одна "координата"
  в мыслительном процессе - появляется желание найти
  яркий текстовый образ, имеющий соответствующую визуальную реализацию.
  Пусть это будет на сегодняшнем уровне развития ИИ-художников
  и не шедевром "уровня Леонардо", но кое-что может помочь
  увидеть/отшлифовать новое в том, что первоначально выглядит просто
  как "грубый", "плоский" или заурядный текст.
  
  //// Это пока, можно считать, "чистая теория".
  //// Попробовал применить это на практике -
  //// зашел на сайт ruDALL-E
  //// https://rudalle.ru/kandinsky2
  //// хотелось посмотреть как выглядит "Мета-Лоция"
  //// в представлении кого-то из маринистов, любимых импрессионистов,
  //// или даже Эшера. Но вышел "облом":
  //// "500 ERROR Что-то пошло не так. Вернитесь на главную страницу."
  //// Так что, по-видимому, мне еще рановато общаться с
  //// "генеративными художниками".
  //// Хорошо, "мы к этому еще вернемся".
  //////// Вернулся, посмотрел. Что-то получилось, что-то нет.
  //////// Общий вывод - использовать уже можно, хотя трудозатрат много.
  //////// Но мышление точно развивает и новый ракурс на текст точно появляется.
  //////// Постараюсь сделать что-то вроде резюме/рекомендаций,
  //////// но чуть позже, и, наверно, как-то отдельно - очень интересная тема.
  
  ///////// Вот кстати хороший список ссылок на доступные ИИ-инструменты.
  ///////// "Полезный список нейросетей"
  ///////// https://oko-planet.su/politik/politiklist/695394-poleznyj-spisok-nejrosetej.html
  
  =========
  
  Обоснование выбора термина "Мета-Лоция".
  В оглавление.
  
  Задача найти яркий, запоминающийся и информативный образ/слово/фразу
  наверно, очень часто является основной/ключевой даже просто в самом
  решении написать какой-то текст.
  Как говорится, "Меч Ньютона" острее "Бритвы Оккама",
  тем, что он "созидает", а не "отсекает".
  
  Весь этот цикл сложился в голове в достаточно последовательную схему,
  практически сразу же, как только нашлось такое слово - "Мета-Лоция".
  До тех пор все крутилось вокруг слова "Мета-Физика", ничего путного
  никак не вырисовывалось - слишком многие темы хотелось охватить,
  да еще и в собственном не сильно формализованном стиле.
  А "метафизика" накладывает достаточно большие ограничения
  и на сам материал и еще больше на стиль подачи этого материала,
  а еще сложившаяся "наукообразная" терминология, "непререкаемые авторитеты",
  "живые и мертвые" идеи, и обязательные "ритуальные танцы".
  И было внутренне ощущение, что мне это точно "не надо"...
  
  А так нашлось нужное слово и пошел процесс "кристаллизации",
  ключевое слово "легко провернулось",
  в казалось бы, навсегда "заржавевшем замке" и ...
  
  \\\ ...Упадут сто замков, и спадут сто оков,
  \\\ И сойдут сто потов с целой груды веков,
  \\\ И польются легенды из сотен стихов
  \\\ Про турниры, осады, про вольных стрелков....
  
  //// Надеюсь, автора этих строф дополнительно указывать не надо.
  
  Поэтому желаю и Вам найти, углядеть, сотворить свое "заветное слово",
  как "проблеск долгожданного маяка" у "заветного берега".
  и пусть "из искры возгорится пламя".
  
  1 марта 2023 года Андрей Павлович Митасов, Минск, РБ, Порт приписки Земля
  
  ========
  
  Триптих "Путь текста" от "Модели Kandinsky 2.0":
  
  Так ХОЧЕТ представить свой текст автор."Звездочка"
  А таков Текст на самом деле. "Звездочка-Точка"
  Так МОЖЕТ понять текст читатель."Звездочка-Точка-Звездочка"
  
Модель Kandinsky 2.0 нарисовала:  Металоция неведомого Текст Алиса звездочка точка звездочка искры пламя  в стиле Рисунок карандашом cd6afe8ae79e4291bed4777d37e086ad_00000 Модель Kandinsky 2.0 нарисовала:  Металоция неведомого Текст Алиса звездочка точка звездочка искры пламя  в стиле Портретное фото a929879e99b5409e9b787fb2dfb1cfc9_00000 Модель Kandinsky 2.0 нарисовала:  Металоция неведомого Текст Алиса звездочка точка звездочка искры пламя  в стиле Картина маслом d1388cff82b14de38ea53fa052df100b_00000
  
  ========
  
  25.03.2023 18:00
  
  Часть2. На пути от человеческого языка к языку ИИ-систем:
   Первые шаги по освоению возможностей ГПТ-моделей.
   Рекомендации по написанию текстов с помощью ГПТэшек.
   О законе Ципфа-Мандельброта.
   Больше статистик хороших и разных.
   Первые практические опыты использования ИИ-системы Бинг.
   Рекомендации по работе с диалоговыми ИИ-системам.
   Наблюдения о написании собственных текстов.
   Еще кое-что о написании собственных текстов.
   И снова рекомендации по работе с диалоговыми ИИ-системам.
   Об эмоциональных составляющих промпта.
   "Тарабарские" языки, используемые ИИ-системами.
   А что собственно считают текстом языковые модели?
   Промежуточные выводы о соотношении текста для человека и LLM.
  
  =======
  
  30.04.2023 18:05
  
  Первые шаги по освоению возможностей ГПТ-моделей.
  В оглавление.
  
  Представляется, что после "революции ChatGPT",
  настает необходимость привыкать широкому распространению ГПТ-моделей
  и продуктов их "жизнедеятельности",
  но при этом еще и учиться как их использовать для своих задач.
  Вот с этой точки зрения стоит посмотреть,
  что уже сейчас можно делать без особого напряга усилий и других затрат.
  
  Сервисов обещающих "близкое знакомство" с ГПТэшками
  уже вполне достаточно, а будет с каждым месяцем еще больше,
  на любой вкус и, соответственно, "кошелек".
  И чтобы не быть разочарованным в возможностях этой технологии,
  стоит осваивать их постепенно,
  чтобы бы лучше понять свои собственные запросы/потребности,
  и возможные результаты от применения этих ГПТ-моделей.
  
  Для самого начала знакомства рекомендую использовать сервис
  https://turbotext.pro/ai
  в режиме "Всезнайка".
  В бесплатном режиме он позволяет сделать два запроса в сутки
  к ChatGPT-3 или чему-то примерно этого уровня.
  
  Вроде как, два запроса в день это критически мало,
  но с другой стороны, с точки зрения обучения,
  этого вполне достаточно,
  если подходить к каждому запросу вдумчиво и ответственно.
  Как раз дня обычно хватает, чтобы понять что собственно требуется спросить.
  Ну и заодно проанализировать/проверить предыдущие ответы.
  Во-всяком случае, для меня большее количество запросов
  достаточно сильно "напрягает".
  Обычно первый запрос более общий,
  и по ответу на него становится видно, что именно упущено в запросе.
  а во втором запросе уже удается получить более конкретный/нужный результат.
  Это достаточно сильно дисциплинирует мыслительный процесс.
  
  Вообще-то, "Всезнайка", вообще "страдает" некоторой неконкретностью,
  но, как ни странно, дает более понятные ответы,
  или такие формулировки, которые оказываются куда полезнее/понятнее
  чем даже конкретные статьи из Вики.
  Т.е. его можно вполне использовать для какой-то общей характеристики
  интересуемой области/проблемы,
  из которой уже можно понять, что и где стоит поискать в обычном поисковике.
  А вот с конкретикой у него похуже.
  
  Для дальнейшего освоения ГПТ-моделей можно рекомендовать
  https://chadgpt.ru/
  Это уже более продвинутая модель, на сегодня это GPT-3.5,
  и это очень четко заметно, по сравнению с "Всезнайкой"
  даже "невооруженным взглядом" видна большая информационная база
  и определенная "страсть к конкретике" в некоторых областях.
  Но тут с бесплатным доступом еще печальнее - 10 запросов в месяц.
  Но для того, чтобы оценить потенциал даже этого уровня ГПТэшек
  этого вполне достаточно.
  
  А для того, чтобы понять нужно ли переходить на платные тарифы,
  на мой взгляд, требуется, во-первых,
  сформулировать цель работы с ГПТ-моделями.
  Во-вторых, отработать технику работы с ними,
  т.к. ГПТэшки пока это далеко не "вундерваффе",
  а толь ко инструмент результаты которого нужно как-то перерабатывать/"шлифовать".
  И в-третьих, и это наверное самое важное/сложное,
  научиться формулировать запросы применительно к особенностям ГПТэшек.
  
  И в этом отношение ограничение количества запросов в день/месяц,
  на мой взгляд очень полезно. Обучение этому искусству дело не быстрое,
  и без лимита запросов, может, вообще, быть затруднительным,
  так как "общение" с ГПТэшкой без ограничений быстро скатывается
  в какое-то подобие именно "чата", где цель/результат быстро теряется из виду.
  Здесь точно также как и в обычной жизни, "половина" ответа,
  должна содержаться в самом вопросе,
  А в отношении "понимания" ответа, то вопрос содержит, обычно,
  уже "три четверти".
  
  Модель ГПТэшки более продвинутой версии (GPT-4)
  https://bothub.chat/
  Не проверял/осваивал, так как не понял как его запустить,
  но, честно говоря, особой надобности пока у меня в этом нет.
  
  Есть еще ГПТэшка заявляющая, что она GPT-4,
  хотя тестирование утверждает все-таки GPT-3.5
  https://tele.click/chatgpt
  Эту вообще даже не пытался запускать, поскольку я принципиально "бестележный".
  
  ---------
  
  Ну вот, вводные слова закончились,
  а теперь несколько ссылок на материалы,
  которые могут помочь как-то освоиться с этой темой,
  дать достаточно полезные, в том числе и не тривиальные, рекомендации
  по составлению запросов и интерпретации ответов ГПТэшек,
  и подсказать направления, в которых можно попытаться их использовать,
  кроме "поболтать за жизнь".
  
  "Хакнуть ChatGPT.
  Учимся делать правильные запросы для использования в маркетинге."
  Автор: kuznetsovatext (Анастасия Кузнецова)
  https://habr.com/ru/articles/729420/
  17 апр в 01:14
  
  "Что делать с <галлюцинациями> GPT"
  Как я решил проблему т.н. "галлюцинаций" большой языковой модели
  в своем сервисе с помощью двойных зеркальных вопросов.
  Автор: exwill (Калимулин Михаил Игоревич)
  https://habr.com/ru/articles/730208/
  20 апр в 15:36
  
  "Исправляем грамматику с помощью GPT-4 API"
  Автор: einhorn (Дмитрий Лукьянов)
  \\\ С самого выхода ChatGPT я начал ее использовать
  \\\ для решения задач корректуры текста:
  \\\ устранения опечаток, исправления ошибок и улучшения стилистики.
  https://habr.com/ru/articles/732394/
  29 апр в 10:55
  
  "Как отличить ChatGPT-3.5 от ChatGPT-4: разоблачение мифов"
  Автор: rajce
  https://habr.com/ru/articles/731802/
  28 апр в 19:07
  
  "Как распознать текст, написанный нейросетью,
  и как это использовать в B2B-бизнесе"
  Автор: LyudmilaAlt (Людмила)
  https://habr.com/ru/companies/altcraft/articles/732240/
  28 апр в 13:07
  
  Но все это "теория", и ее можно приводить еще и еще,
  материалов с такого рода рекомендациями намного больше, чем приведено.
  Но без реальной "практики" понять и освоить даже простейшие и очевидные
  из этих рекомендаций, на самом деле, малореально
  - слишком непривычно это общение с "машинным разумом".
  
  Ну и в конце хочется пожелать, все-таки, больше внимания уделять
  собственным текстам/запросам, чем ответам сгенерированным ГПТэшками
  - прогресс ГПТ-моделей идет семимильными шагами,
  и то что сейчас они делают ошибки или неудовлетворительные ответы,
  это очень скоро исправится.
  А вот улучшение собственных возможностей/умений идет намного медленней,
  и тут требуются основные усилия и настойчивость.
  И, наверно, немного удачи в виде достойной/интересной цели.
  
  
  ===========
  
  25.05.2023 13:34
  
  Рекомендации по написанию текстов с помощью ГПТэшек.
  В оглавление.
  
  На Хабре появилалась интересная статья о написании статей с помощью ГПТэшек.
  Но судя по ожесточенному накалу в комментариях,
  она может очень скоро уйти "на редактирование".
  Поэтому зафиксирую ее и свои комментарии к ней здесь
  во избежании "забывчивости" редакции Хабра.
  
  "3500 в час с ChatGPT"
  Автор: mvideo (М.Видео-Эльдорадо), biblik (Александр Жадан)
  https://habr.com/ru/companies/mvideo/articles/737250/
  24 мая 2023
  
  .......
  
  Привет, Хабр! Меня зовут Саша,
  https://habr.com/ru/users/biblik/
  и я тот самый студент,
  который написал диплом с помощью ChatGPT за сутки.
  Всю историю можно почитать на Хабре тут, тут,
  https://habr.com/ru/news/722380/
  https://habr.com/ru/news/714706/
  где всерьез обсуждалась идея лишить меня диплома,
  и тут,
  https://habr.com/ru/news/716942/
  где недоуменно размышляли, что со мной делать.
  Пока "Антиплагиат" трудится над совершенствованием системы (читать тут),
  https://habr.com/ru/companies/antiplagiat/articles/728112/
  я решил провести вас по пути джедая,
  использующего силу ChatGPT.
  
  ..........
  
  Я и редакция М.Клик договорились,
  что попробуем сотрудничать в формате "автор + редактор",
  где я являюсь автором с ChatGPT, а на стороне М.Видео - редактор.
  Мы собрались проверить,
  1) получается ли ускорить производство статей с помощью ChatGPT,
  сохраняя стиль медиа;
  2) повышается ли трафик благодаря подобным материалам;
  3) можно ли масштабировать этот процесс.
  //// Понятно, что для индивидуальной работы без участия редактора,
  //// требуются и другие цели типа "проверки орфографии"
  //// и/или "поиск/проверка новых направлений/идей".
  
  .........
  
  Создание этих тем я начал в ChatGPT.
  Сделал запрос на русском:
  Написать [количество] тем для статей в категории [название].
  Референсы: [темы списком].
  За 40 секунд получил предложения,
  убрал неподходящее для блога о технологиях.
  Также просил продолжить, если не хватало тем.
  //// В материале есть четкий скрин, который очень наглядно это иллюстрирует.
  //// И наверно такого рода запрос имеет смысл делать сразу же
  //// для оценки потенциала той ГПТэшки, с которой в данный момент
  //// происходит общение. В частности Всезнайка на подобный запрос
  //// "о направлениях применения использования закона Ципфа-Мандельброта
  //// для анализа логики нейросетей" тупо "сломался".
  //// Хотя перед этим бойко чирикал о перспективах применения
  //// этого закона во многих сложных областях.
  
  Затем я перешел к планам и сформулировал запрос:
  Сформировать план статьи [название темы].
  Он должен состоять из [число] подзаголовков.
  Несколько минут ожидания, и план готов.
  //// И это полезная рекомендация, которую тоже полезно сделать,
  //// чтобы оценить/сравнить свое собственное видение изложения темы
  //// со "среднестандартизированным".
  //// И опять же это сильно помогает оценить потенциал ГПТэшки
  //// но уже не в плане "креативности", "систематичности" или "академичности".
  
  Изначально я пользовался моделью GPT-4,
  так как ответы выходили осмысленными и без повторов.
  После 25 запросов уперся в лимит, и переключился на GPT-3.5.
  //// И опять же есть достаточно качественная иллюстрация этих различий.
  //// Да и сам принцип использовать не одну, а несколько разных ГПТэшек,
  //// с возможностью сравнения их реакций на одни и те же вопросы,
  //// весьма конструктивен.
  
  Закончив с генерацией тем и планов,
  оформил и отредактировал их в документе, чтобы показать редакции.
  Получилось 25 тем в категориях
  "Лайфхаки", "Покупки", "Гаджеты и приложения", "Гик и Поп культура",
  "Технологии и инновации".
  Более "человечно" вышло готовить лайфхаки, рекомендации и сравнения,
  а технологии или рецепты оказались наименее подходящими для медиа.
  После разбора мы взяли в работу семь тем, четыре ушли в бэклог,
  при этом 14 не пошли в дальнейшую работу.
  На эту задачу с ChatGPT ушло чуть меньше 2 часов.
  
  Впоследствии мы оптимизировали процесс и утверждали сначала темы,
  а уже затем переходили к планам и статьям.
  //// Т.е. количество "отходов", по сравнению с чисто человеческой работой,
  //// раза в два больше, а времени затрачено меньше,
  //// плюс что-то остается "заделом на будущее".
  //// Но разбиение работы на последовательные этапы, иерархически структурированные,
  //// полезно, наверняка, в любой работе а не только в диалогах с ГПТэшками.
  //// И на каждом этапе будут свои "отходы", которые могут оказаться
  //// весьма полезными в каких-то иных темах.
  
  Теперь немного о процессе:
  в М.Клик пишут статьи о технологиях в инфостиле.
  Автор готовит материал, отдает редакции на фидбек и оформление,
  после чего статья выходит.
  Мне же нужно было сначала получить текст для статьи от нейросети.
  Созданные мной материалы можно разделить на авторские
  и SEO, тексты, написанные с учетом принципов ранжирования поисковых систем
  с целью продвижения сайта в ТОП выдачи.
  В авторских я использовал сгенерированный план статьи,
  в SEO - генерировал по тз с учетом ключевых слов.
  //// Вроде как абзац не важный и можно было бы пропустить,
  //// если бы не указание на необходимость доработки текста
  //// в соответствии с конкретным "стилем" или другими "техническими деталями".
  //// Часто в этих самых "деталях", скрывается "сами знаете кто".
  
  Какую нейросеть выбрать для авторского текста
  
  Для авторских статей я использовал утвержденные планы,
  сгенерированные ChatGPT.
  Давал запрос:
  Напиши статью по теме [тема статьи].
  Используй следующий план: [вставить план с новой строки].
  После пары минут ожидания переносил получившийся текст в Google Doc
  для вычитки.
  //// А использовать ту же или другую ГПТэшку для "вычитки" пока не получается?
  //// Или при "вычитке" главное не "грамматика", а "стилистика" и "семантика"?
  
  Получить с первого запроса качественный текст у меня не получилось ни разу.
  Поэтому я перечитывал получившийся текст и додумывал,
  что полезного добавить.
  Редактировал вступительную часть и конструкции,
  запрашивал дополнительную информацию у ChatGPT.
  Доработку делал за несколько минут с помощью запроса
  Добавь информацию в квадратные скобки:
  текст [идея, как расширить текст]
  или
  Добавь полезные данные к тексту.
  Повествование в тексте должно быть в нескольких абзацах,
  избегаются повторы:
  [выбранная часть].
  Я не спрашивал дополнение отдельно,
  а ставил скобки, чтобы дополнительный кусок
  сразу органично вставал в текст с учетом контекста.
  //// И есть вполне доступный для понимания не совсем ясного описания "скриншот".
  
  Материал на русском обычно получается на 2 500 - 3 000 символов.
  В процессе работы выяснил, что тот же текст можно получить на английском
  уже на 3 000 - 5 000 символов,
  где будет больше примеров или интересных фактов.
  Также чуть доработал запрос:
  Act as a writer.
  You need to write an article on the topic [тема статьи]
  in a friendly tone for many readers.
  Use the plan below: [вставить план с новой строки].
  //// Тоже неплохая идея использовать более понятные для понимания ГПТэшек
  //// в качестве шаблонов промтов, заготовки на английском языке.
  //// Стоит запомнить и проверить.
  
  Помимо ChatGPT, пробовал использовать Perplexity.
  https://www.perplexity.ai/
  Это чат-бот, который сочетает функции искусственного интеллекта
  и поисковой системы.
  Как я ожидал, хорошо подойдет для рисерчей и ссылок.
  Например, для подборки игр, которые очень сложно пройти,
  я попросил написать процент прохождения игр, указать источники.
  Для Elden Ring я получил цифру в 17%,
  что проверялось в нескольких источниках.
  А вот для других игр показатель найти не удалось,
  так как не было источников или они выглядели недостоверно.
  Впрочем, тут и без нейросети сложно понять,
  сколько геймеров на самом деле прошли игры из подборки.
  //// Надо будет как-нибудь попробовать.
  
  В основу статьи о надлежащем выборе чистящих средств для дома
  лёг ChatSonic.
  Дал запрос по схожему тз, но результат оказался
  в два раза длиннее и с меньшим количеством полезных примеров,
  чем смог бы ChatGPT.
  Но уже на другом примере
  - статьи про смарт-часы -
  я уловил преимущество ChatSonic в том,
  что для составления ответов используется Google с актуальной информацией.
  //// Как много стало всяких ГПТэшек со своими "фичами".
  
  .......
  
  Написание SEO-статей
  
  SEO-статьи нужны для повышения показов в поисковых запросах по ключевым словам.
  В этих статьях есть четкое тз на эти "ключи",
  количество символов и план.
  Есть еще референсы, на основе которых надо подготовить текст
  с оригинальностью выше 65%.
  
  Оригинальное тз состоит из более 4 тысяч символов,
  что не сможет обработать ChatGPT.
  Поэтому я взял из тз план и главные ключевые слова,
  перевел на английский и сделал запрос уже на 592 символа.
  ChatGPT обработал его за несколько минут,
  сделал статью по плану и применил ключевые слова.
  //// Вполне себе инженерный подход.
  
  Основной текст я точечно расширял
  по запросам на дополнения в квадратных скобках,
  а также сам, если разбирался в теме.
  Например, для статьи про работу нейросети я просил ChatGPT расписать,
  как обрабатывается входящий запрос пользователя и как выдается ответ.
  Но часть про риски развития ИИ я написал самостоятельно.
  Если бы попросил ChatGPT, Perplexity или ChatSonic написать текст
  по такой теме, мог бы получить что-то без примера
  или менее живое по стилю, но с примером.
  //// И обязательная "доработка напильником" - как же без этого.
  
  SEO-статья получается раза в два больше, чем авторская.
  //// Больше "воды"?
  В ней еще должны содержаться основные и второстепенные ключевые слова
  - первых немного, а вторых больше,
  но часть из них можно опустить.
  Чаще всего мне приходилось добавлять ключевые слова вручную,
  поскольку подгонять запрос в ChatGPT под объем текста до 5 000 символов
  вышло бы дольше.
  
  Работа с редакцией
  
  Получив мой текст, редакция обычно просила изменить очередность
  или комбинирование подзаголовков,
  после чего текст читался легче и интереснее.
  Также были постоянные замечания относительно актуальности фактов.
  
  ......
  
  Исправление слов на более простые.
  Не "самодвижущиеся автомобили", а "самоуправляемые автомобили".
  Не "пряные ингредиенты", а "пряности".
  Не "типов настройки", а "режимов".
  Текст может звучать топорно и требовать вычитки после перевода на русский.
  
  Расширение подзаголовков по интересным особенностям.
  Базово я представляю, как можно расширить текст на этапе запросов,
  но в процессе доработки могут поступить предложения от редакции
  по их экспертизе.
  Такие правки прогоняю в ChatGPT командой
  дополнить информацию в квадратных скобках.
  Черным цветом указан текст до редактуры, желтым - после.
  
  ......
  
  Удаление повторов.
  Например, убираю капитанский или водянистый текст сам,
  но меняю местами и адаптирую по смыслу части текста с помощью ChatGPT.
  Часто попадалась вводная фраза "такие как" после уточняющего слова,
  поэтому первым делом чистил это без потери смысла.
  
  Правки занимают по 20-30 минут,
  что аналогично по времени на составление первой версии.
  Получается отредактировать за одну или две итерации.
  Остается добавить обложку, ссылки и можно постить.
  
  Автор vs ChatGPT
  
  Чтобы не показалось,
  что генерировать текст в нужном виде легко и быстро, провел эксперимент.
  Я сгенерировал статью про беспроводную зарядку.
  Текст на эту же тему независимо от меня написал другой автор.
  
  Попросил у редактора ТЗ.
  По нему нужно сделать статью от 8 000 до 11 000 символов,
  есть ключевые слова, план, требования к оригинальности.
  Перевел эти указания на английский,
  сделал запрос в ChatGPT так же,
  как и для SEO-статьи.
  
  При первом запросе у меня вышел текст на 3 600 символов.
  Я почитал статьи других авторов,
  добавил уточнения в свой материал.
  Часто использовал следующие команды в ChatGPT:
  
   Перепиши проще: [вставить текст].
   Например, упростил предложение до
   "Когда зарядное устройство включено в сеть,
   ток проходит через катушку и создает магнитное поле".
   Первоначально было длинно и много воды.
  
   Дополни текст в квадратных скобках: текст [команда по изменению] текст.
   Например, в предложении
   "Разработанный Консорциумом беспроводного питания,
   он стал общепринятым стандартом для большинства производителей"
   я попросил переписать иначе, почему Qi стал общепринятым стандартом.
   Получилось так:
   "Этот стандарт был разработан Консорциумом беспроводного электропитания
   и стал главным выбором большинства производителей
   благодаря своей универсальности и надежности".
  
   Дополни текст в квадратных скобках.
   После адаптируй текст, убери повтори, сделай его более читаемым:
   текст [команда по изменению] текст.
   Это доработанный вариант предыдущего запроса,
   после которого текст органичнее читается.
  
   Перепиши иначе, разбей на другое количество предложений: [вставить текст].
   Так из одного сложного предложения получил такой вариант:
   "Чтобы правильно использовать беспроводное зарядное устройство,
   важно сначала понять стандарты этой технологии
   и то, как они отличаются друг от друга.
   Давайте более подробно рассмотрим самые популярные
   и широко используемые стандарты беспроводной зарядки".
  
  Отредактировал ключевые слова, отметил в документе.
  Суммарно получилось 9 000 символов за час работы от первого запроса в ChatGPT.
  
  Если сравнивать со статьей другого автора,
  то у него похожая структура,
  есть дополнительные подзаголовки с подробностями,
  которых не было у меня, например,
  "Оригинал и аналог беспроводной зарядки - есть ли разница".
  В остальном написание и факты похожи,
  но при этом его вариант мне нравится больше.
  //// Т.е. авторские статьи, возможно, всегда в чем-то будут привлекательней.
  //// И если не гнаться за скоростью и количеством,
  //// а использовать ГПТэшки в "разумных дозах", и там где от них явная польза,
  //// то это свойство "авторских статей" возможно не исчезнет.
  
  Но оценивал нас беспристрастный редактор М.Клик.
  По его словам, тексты от нейросети и автора примерно равны по качеству.
  Если для написания не требуется экспертиза или общение со специалистами.
  Сгенерированным текстам не хватает живой человеческой интонации,
  интересной подачи и юмора, который иногда нужен текстам.
  Кроме того, языковые модели не умеют достаточно точно
  подбирать внешние источники и проставлять ссылки.
  Для некоторых текстов это не проблема,
  но все-таки нужно очень аккуратно выбирать,
  какие тексты можно доверить нейросети.
  Из плюсов:
  модель хорошо справляется с интеграцией ключевых слов для SEO-оптимизации.
  
  Что в итоге
  
  Благодаря ChatGPT получилось создать 20 статей для М.Клик
  (на май 2023 еще не все опубликованы)
  и одну для эксперимента в этом посте.
  //// О как. Оказывается, что я начал комментировать продукцию "иного разума".
  //// Ну что ж, оценка "неплохо". По сравнению с большим количеством
  //// "авторских статей" за последние три месяца так даже "очень неплохо".
  //// Доступно, конкретно и по делу.
  Помимо генерации и редактирования текста,
  потребовалась насмотренность и экспертиза,
  так как ChatGPT и другие нейросети не сделают всю работу за автора.
  Идеальная схема:
  доверять ChatGPT задачи точечно,
  а затем дополнять и редактировать текст с проверкой информацией.
  
  Чего удалось добиться:
  
   Ускорили производство статей с помощью ChatGPT, сохраняя стиль медиа.
   Когда у автора уходит около 2 недель на работу с материалом
   по нескольку итераций/часов в день,
   у меня выходит около часа с 1-2 итерациями на материал.
  
  .....
  
  Масштабировать процесс написания статей с помощью нейросетей пока рано.
  //// Но учится использовать ГПТэшки в работе - самое время.
  Нередко у меня выходило генерировать сразу несколько материалов за 2-3 часа,
  но затем приходилось дожидаться фидбека от редактора
  в течение нескольких дней из-за загрузки по другим авторам.
  Обратная сторона процесса
  - из-за ускорения производства материалов
  не выйдет так же быстро их редактировать.
  А подчас придётся подходить даже более тщательно.
  
  Мы с М.Клик не хотим генерировать статьи в таком же большом объеме,
  так как человек с экспертизой пока сделает лучше.
  Нейросеть часто дает усредненный ответ,
  который надо корректировать и направлять,
  чтобы подсветить интересные особенности.
  Также я не забываю, что только автор может поделиться личным опытом
  и рассказать об актуальном.
  ChatGPT и другие нейросети, увы,
  пишут без души.
  Человек напишет лучше, пускай и не очень быстро.
  
  Но писать SEO-статьи с помощью ChatGPT возможно.
  Получается не хуже автора, при этом быстро.
  Их я и продолжу делать с редакцией М.Клик.
  
  Что касается будущего нейросетей
  - иностранным нейросетям не хватает поддержки русского языка.
  Возможно, прорыв кроется в развитии российских нейросетей,
  и когда нейросети смогут не просто искать и обрабатывать,
  но и верифицировать информацию.
  //// Да приходится ждать.
  //// Но лучше это делать, понемногу к этому готовясь.
  
  //// В общем, мне статья понравилась. Очень конкретная,
  //// с минимумом воды, и конкретными примерами,
  //// и даже элементами сохраненного авторского стиля.
  //// Так что, возможно "не так страшен черт как его малюют".
  //// И еще если автор действительно написал дипломную работу
  //// по предлагаемой теме, то на мой взгляд,
  //// диплом он получил вполне заслуженно.
  
  .....
  
  //// И жуткий "бэтл" в комментариях к статье.
  //// Но местами очень забавный.
  
  ========
  
  25.05.2023 19:03
  
  О законе Ципфа-Мандельброта.
  В оглавление.
  
  Наткнулся на один материал, показавшийся интересным,
  как с точки зрения анализа текста,
  так и в плане возможного направления анализа "иных логик".
  
  В.Е. Фирстов, Р.А.Иванов
  "Из истории стенографии
  и интерпретации закона Ципфа-Мандельброта в учебном процессе"
  http://vestnik.yspu.org/releases/2013_4e/06.pdf
  Ярославский педагогический вестник
  - 2013 - ? 4 - Том III (Естественные науки) стр. 14-20
  
  ------
  
  1. Из истории языка и стенографии.
  
  Язык человеческого общения - это область,
  где принцип математической абстракции реализовался раньше всего
  в виде письменности, представляющей формализацию человеческой речи
  с помощью символов.
  
  .......
  
  С появлением письменности довольно быстро возникла потребность
  в придании необходимой конфиденциальности письменных коммуникаций,
  реализация которой проводится в рамках приложений математики
  и на этом пути зародились такие междисциплинарные направления,
  как криптография (шифрование) и криптоанализ (дешифрование).
  Об этом упоминает известный древнегреческий историк Геродот в V в. до н. э.
  Одними из первых стали использовать так называемые
  подстановочные криптограммы,
  которые формировались посредством некоторой
  (конфиденциальной) перестановки букв соответствующего алфавита [3].
  Однако, вскоре, обнаружили простой способ дешифровки таких криптограмм,
  особенно, если зашифрованное сообщение достаточно длинное.
  Причина оказалась психолингвистического свойства
  и состояла в том, что различные буквы естественного языка
  в содержательных текстах встречаются не одинаково часто.
  
  Обнаруженный факт отражает одну из важнейших
  статистических закономерностей языковых структур
  и является основой современной структурной лингвистики,
  составляя основу соответствующих частотных словарей.
  Например, располагая буквы в порядке убывания частот
  (начиная с самой часто появляющейся буквы),
  для русского языка появляется последовательность о, с, а, и, т, н, с, ...;
  для английского - e, t ,a, o, n, r, i, ...;
  для немецкого - e, n, i, s, t, r, a, d, ...;
  для французского - e, s, a, n, i, t, u, r, ...[17].
  Известно [5], что с изобретением электромагнитного телеграфа (1837 г.),
  передающего сообщения при помощи телеграфного ключа,
  С. Морзе (1791-1872 гг.) разработал специальную азбуку
  - двоичный код из точек и тире.
  При этом, естественно, для наиболее часто встречающихся букв
  комбинации точек и тире должны быть проще,
  что, собственно, и сделал Морзе,
  передавая букву e - точкой, t - одним тире, a - точка-тире и т. д.
  
  Другое важное направление структурной лингвистики,
  зародившееся в эпоху древней письменности,
  связано с разработкой методов скоростного письма
  - стенографией.
  По имеющимся данным, стенография существовала уже в Древнем Египте,
  где служила для записи речей фараонов,
  и затем, примерно в IV в. до н. э., появилась у древних греков.
  Об этом свидетельствует найденная в Афинах в 1883 г.
  мраморная <Акропольская плита> с высеченными стенографическими знаками,
  которую относят к 350 г. до н. э. [4].
  Древняя система стенографии являлась довольно примитивной
  и имела <словный> характер,
  т. е. каждый стенографический символ (знак) выражал некоторое слово.
  Как следствие, алфавит стенографических символов исчислялся тысячами знаков,
  запомнить которые было очень трудно,
  и еще труднее реализовать при быстром письме.
  Стенография оставалась <словной> до начала XVII в.,
  когда появилась более совершенная буквенная система стенографии,
  основанная на несколько иных принципах, связанных
  с частотным анализом слов в тексте.
  
  ......
  
  2. Закон Ципфа-Мандельброта (Ц?М)
  - это частотная закономерность всякого семантически коррелированного сообщения.
  На этот факт, впервые, обратил внимание
  стенографист французского парламента Ж.-Б. Эступ (1916 г.)
  в поисках оптимальных методов стенографии [8],
  который обнаружил, что при достаточно большом объеме информации
  в таких сообщениях имеет место следующая частотная зависимость:
  
  p(i)*i = K = const, i=1;2;:, (1)
  
  где p(i) - относительная частота i-го слова в словарном списке.
  
  В 1935 г. вышла монография американского лингвиста Дж. Ципфа
  <Психобиология языка> [17],
  в которой приведена содержательная трактовка обнаруженной зависимости (1),
  после чего, собственно, она и стала именоваться <законом Ципфа>.
  Фактически, установленная закономерность (1) показывает,
  что слова, требующие больше времени для их прочтения вслух,
  должны встречаться реже,
  чем слова короткие, т. е. легко произносимые.
  
  В 50-х гг. XX в. Б. Мандельброт к интерпретации закона Ципфа
  привлек кибернетические соображения
  на основе теории оптимизации кодирования информации [8],
  и, таким образом, пришел к следующей зависимости:
  
  p(i)*(B+i)*y = K, K; B; y = const; i=1;2;:, (2)
  
  которая известна как закон Ципфа-Мандельброта (Ц-М)
  и, в частности, при B=0, y =1 этот закон переходит в закон Ципфа (1).
  
  ......
  
  8. Мандельброт, Б. Теория информации и психолингвистика: теория частот слов
  [Текст] / Б. Мандельброт. //
  Математические методы в социальных науках.
  Сб. статей. - М. : Прогресс, 1973.- С. 316-337.
  
  ......
  
  Попутно обнаружился поразительный факт:
  закон Ц-М (2) хорошо согласуется с частотными данными
  отдельных литературных произведений с четкой сюжетной линией
  и практически не выполняется для частотных данных
  по произвольным лексическим выборкам,
  не обладающих смысловой корреляцией.
  //// Вот это, наверное, самый важный момент в этой статье.
  //// "Смысл" как-то отображается "статистикой".
  //// Причем достаточно устойчивой.
  Иными словами, закон Ц-М оказался законом не языка,
  а текста,
  представляющего
  отдельное семантически коррелированное информационное сообщение.
  
  3. Универсальные проявления закона Ц-М.
  Рангово-степенные статистики (1); (2),
  выявленные в психолингвистике при анализе частот слов
  семантически коррелированного сообщения,
  в дальнейшем обнаружили универсальный характер, например:
  
  - итальянский экономист В. Парето,
  рассматривая распределение богатства и доходов в Англии XIX в.,
  обнаружил, что бoльшая часть доходов и материальных ценностей (80 %)
  принадлежит меньшинству людей (20 %).
  Если провести ранжировку социума по возрастанию капитала,
  то получается распределение со статистикой вида (2),
  где B=0, y=1,5 [16];
  
  - немецкий географ Ф. Ауэрбах, анализируя численность населения городов
  в административном регионе, выявил зависимость, аналогичную закону Ципфа (1) [2];
  
  - американский математик А. Лотка [2] показал,
  что деятельность ученых, выраженная количеством их публикаций,
  выражается законом (2) с параметрами B=0, y=2;
  
  - закономерности (2) наблюдаются в статистике чрезвычайных ситуаций
  (аварий, наводнений, ураганов, и т. п.),
  с ранжировкой по числу погибших [7];
  
  - степенные статистики (1); (2) описывают распространение вирусов в Интернете
  и ВИЧинфицированного населения [6];
  
  - отмечается устойчивая тенденция
  прикладного использования законов Ципфа (1) или Ц-М (2)
  при построении прогнозов, минимизации рисков,
  для составления тезаурусов поисковых компьютерных систем [7], [6];
  
  - анализ структуры живописных и музыкальных форм творчества [10]
  также обнаруживает статистики вида (2).
  
  Природа рангово-степенных статистик стала проясняться
  только в последние десятилетия.
  Оказалось, что, если для нормально распределенной случайной величины
  действует <правило 3-х сигм> (среднеквадратических отклонений),
  по которому вероятность отклонения случайной величины
  от среднего значения более чем на три сигмы,
  ничтожно мала (менее 0,001),
  то для степенных статистик эта вероятность убывает гораздо медленнее.
  //// Так называемые статистики с "тяжелыми хвостами".
  Поэтому вероятность редких событий для степенных статистик
  оказывается выше,
  чем для статистик с нормальным законом распределения.
  Поведение такого рода является характерной чертой
  многих сложных систем,
  для которых одно неординарное событие
  обуславливает возникновение длинных причинно-следственных корреляций,
  порождающих лавину изменений
  (не исключая катастрофический сценарий),
  посредством которых система переходит в новое качество
  или приобретает новое содержание.
  
  Цель данной работы - проиллюстрировать на примерах
  проявления закона Ц-М в учебном процессе.
  
  ......
  
  //// Далее в работе приводятся соответствующие данные и их обработка
  //// в соответствии с законом Ц-М.
  
  //// Их них видно что на реальных, но не очень больших массивах данных
  //// закон Ц-М подтверждается только в первом приближении.
  //// А при внимательном рассмотрении графиков
  //// "в двойных логарифмических координатах"
  //// явно наблюдаются и какие-то еще дополнительные закономерности.
  
  //// Например, "как видно из рисунка 2" это не прямая,
  //// а "наклоненная синусоида" или сигмоида
  //// и "закон" надо подправлять в том смысле, что некоторые элементы/ранги,
  //// либо надо объединять либо расщеплять.
  //// Т.е. налицо определенная корреляция/зависимость чего-то,
  //// что закон в исходной формулировке не отражает.
  //// Но исследователи "почему-то" на это не обращают внимания.
  
  Как видим, ранжировка значимости ошибок в процессе тестирования
  подчиняется закону Ц-М (2).
  
  //// "Как видим" это ДРУГОЙ закон, более сложный, или комбинации законов.
  
  .......
  
  При этом ранжировка значимости ошибок в процессе тестирования
  также следует закону Ц-М (2).
  //// И опять же график свидетельствует, как минимум, еще о чем-то другом.
  
  .......
  
  Это говорит о высокой эффективности данной технологии,
  которая обусловлена возникновением дополнительных каналов
  целевого общения в подгруппах в процессе обучения.
  Отражение данного факта передается коэффициентами закона Ц-М (2):
  //// А вот это интересно.
  //// Дополнительные каналы - дополнительная сложность/взаимосвязь
  //// - налицо другой закон или, если оставаться в исходной парадигме,
  //// речь должна идти о каком-то расширении/развитии закона Ц-М .
  
  ......
  
  6. Закон Ц-М при анализе литературных текстов.
  
  Исследование закономерностей семантически коррелированных
  информационных массивов значительно облегчается при использовании компьютеров
  и с этой целью создана программа для анализа текстов литературных произведений.
  В основу этой программы положена методика обработки литературных текстов,
  изложенная в частотном словаре Л. Н. Засориной [1].
  На рис. 4 в двойных логарифмических координатах
  представлены реализации закона Ципфа-Мандельброта
  для произведения Ф. М. Достоевского <Преступление и наказание> в русской (слева)
  и английской (справа) версиях [15].
  Видно, что языковые особенности (разное количество букв в алфавите)
  //// Скорее это связано, с различием в словарях и грамматиках.
  сказываются на характере коэффициентов корреляций (сплошные линии).
  //// y = -1.005x - 0.985; R**2 = 0.999 (русский вариант)
  //// y = -1.016x - 0.990; R**2 = 0.999 (английский вариант)
  Однако качественный вид зависимостей на обоих рисунках одинаковый,
  что можно интерпретировать как адекватность содержания
  литературного произведения на разных алфавитных языках.
  Подобные исследования имеют дидактический аспект,
  реализуемый при отборе материала для формирования
  математического обучения в области филологии и лингвистики,
  посредством иллюстрации опыта математического моделирования
  при анализе закономерностей гармонии композиционной структуры
  литературных произведений.
  //// О, какая шикарная формулировка:
  //// "закономерности гармонии композиционной структуры".
  
  .......
  
  -------
  
  Итак, имеем закон Ц-М каким-то образом отображающий
  "семантику текста" на "статистику слов".
  Всезнайка на основе ChatGPT утверждает, что это свзано с внутренним
  "самоподобием связного текста", т.е. с его определенной "фрактальностью".
  Понятно, что это "отображение" и "самоподобие" идет по различным "каналам",
  таким как используемые в тексте темы, образы, герои, стилистика,
  место действия, последовательность событий и т.д.,
  И все это "сверху" еще и "отформатировано" грамматикой.
  Т.е. разобраться, что к чему, наверняка, практически невозможно.
  Но если все-таки поставить задачу,
  по "статистике текста" восстановить его "смысл"/"семантику",
  то в каком направлении хотя бы посмотреть стоит?
  И можно ли вообще "статистические законы" текстов
  как-то приложить к анализу "логики" ГПТэшек?
  
  ===========
  
  02.06.2023 20:24
  
  Больше статистик хороших и разных.
  В оглавление.
  
  Тут подобралась еще ссылки на набор очень разнородных материалов,
  которые можно попытаться объединить с точки зрения попытки
  как-то представить тексты и, соответственно, человеческий язык,
  неким статистическим образом.
  Не считаю это направление сильно перспективным или крайне полезным,
  но иметь о нем представление, наверно, необходимо.
  Хотя бы для того, чтобы ориентироваться в нынешних баталиях
  о взаимоотношениях "homo sapiens" vs ChatGPT именно в "текстовых формах".
  
  
  "Исследователи считают, что знаки препинания в текстах
  располагаются в соответствии с распределением Вейбулла"
  Автор: Markaty
  https://habr.com/ru/news/738418/
  29 мая в 22:31
  
  
  Польские учёные проанализировали расстановку знаков препинания
  в самых популярных и сформировавшихся европейских языках
  и опубликовали работу, в которой утверждают,
  что наша пунктуация подчиняется распределению Вейбулла.
  
  Распределение Вейбулла в теории вероятностей
  - двухпараметрическое семейство абсолютно непрерывных распределений.
  Эта функция применяется во множестве отраслей науки:
  статистике, инженерии, электротехнике, метеорологии.
  Например, распределение Вейбулла может описывать время,
  которое люди проводят на сайте:
  большинство уходит через несколько секунд,
  и почти никто не остаётся в течение нескольких часов.
  
  Когда учёные сравнили переведённые тексты
  одних и тех же литературных произведений,
  они получили подтверждение,
  что распределение пунктуации соответствует языку перевода,
  а не языку исходного текста.
  По их мнению, это может служить доказательством,
  что пунктуация - не просто выбор автора.
  Даже когда переводчики пытались сохранить
  оригинальную авторскую стилистику,
  они всё равно использовали знаки препинания
  в соответствии с правилами языка перевода.
  
  Менее требовательными к пунктуации оказались английский и испанский языки.
  И одним из возможных объяснений этого может быть то,
  что в этих языках более формальные конструкции предложений,
  поэтому смысл понятен даже без использования
  всех необходимых знаков препинания.
  Наиболее зависимыми от знаков препинания оказались славянские языки:
  русский и польский.
  
  ------
  
  Для справки:
  Интересная особенность использования распредения Вейбула:
  https://excel2.ru/articles/raspredelenie-veybulla-nepreryvnye-raspredeleniya-v-ms-excel
  
  ......
  
  Распределение Вейбулла является адекватной моделью
  для описания времени безотказной работы многих технических устройств:
  
  время отказа вследствие износа (wearout failure time).
  Отказ должен происходить из-за поломки
  наименее надежного комплектующего (weakest link principle);
  
  время отказа материала по причине разрушения (material strength).
  Отказ должен происходить по причине наличия внутреннего дефекта.
  
  Если параметр альфа = 1 ( экспоненциальное распределение ),
  то причиной отказа должна служить внешняя причина.
  
  //// Вот с примерно такой точки зрения
  //// - внутренняя или внешняя причина вызывает использование "знака препинания" -
  //// и хотелось бы увидеть дальнейшее развитие исследований в этом направлении.
  ......
  
  -----
  
  Спрашивается, ну и к чему все эти статистические изыски,
  если модуль посвящен "анализу текста"?
  
  И еще для справки, чтобы совсем стало "тошно" от математики:
  
  <Правда, чистая правда и статистика>
  или <15 распределений вероятности на все случаи жизни>
  Автор: JamaGava (Вячеслав Архипов)
  https://habr.com/ru/articles/311092/
  30 сен 2016 в 10:46
  
  Из которой становится очевидным, что под любую закономерность
  найдется уже давно изобретенная статистическая формула.
  Вопрос в том, чтобы УВИДЕТЬ эту ЗАКОНОМЕРНОСТЬ.
  А вот с этим, как обычно, проблема.
  
  А теперь переходим к главному "номеру" сегодняшней программы.
  
  02.06.203 18:28
  
  Появилась ОЧЕНЬ хорошая обзорная статья и о ChatGPT и о принципах его работы,
  так как принято это сейчас считать, и сравнение его с логикой
  человеческого мышления и языка и, вообще, много-много всякого интересного
  и познавательного, и все это прекрасно иллюстрировано.
  Статья ОЧЕНЬ объемная, так что настройтесь на длительное чтение.
  
  Что делает ChatGPT: и почему это работает?
  Автор оригинала: Stephen Wolfram
  Автор перевода: TyVik (Виктор)
  https://habr.com/ru/articles/739014/
  2 июня 2023
  
  Смысл статьи, в которой очень продвинутый в этих технологиях специалист
  с сорокалетним стажем пытаясь проанализировать работу ChatGPT
  с позиций "вероятностно-статистической концепции" представления текста,
  в итоге приходит с одной стороны к тому,
  что понимания как это работает "не в принципе, а в кожухе"
  ни у кого сейчас в мире нет.
  А с другой стороны появляются предположения о закономерностях
  в текстах и мышлении.
  
  "Чуть-чуть" приведу цитат из этой большой работы,
  если что-то заинтересует, то смело идите по ссылке - не пожалеете.
  
  ........
  
  Человеческий язык и процессы мышления всегда казались некой вершиной сложности.
  Удивительно, как человеческий мозг с его сетью
  из <всего лишь> 100 миллиардов нейронов
  (и, возможно, 100 триллионов связей)
  может быть ответственен за это.
  Возможно, в мозге есть нечто большее, чем сеть нейронов,
  например, какой-то новый слой неизвестного действия.
  Но теперь, благодаря ChatGPT, мы получили новую важную информацию:
  мы знаем, что чистая искусственная нейронная сеть,
  имеющая примерно столько же связей, сколько нейронов в мозге,
  способна на удивление хорошо имитировать человеческий язык.
  
  И да, это всё ещё большая и сложная система,
  в которой примерно столько же весов нейронной сети, сколько слов текста,
  доступных в настоящее время в мире.
  Но на каком-то уровне трудно поверить,
  что всё богатство языка и вещей, о которых он может рассказать,
  может быть заключено в такую ограниченную систему.
  
  .......
  
  Как же тогда получается,
  что что-то вроде ChatGPT может зайти так далеко,
  как на примере с речью? Основной ответ,
  я думаю,
  заключается в том, что наш язык на фундаментальном уровне
  всё же проще, чем кажется.
  И это означает, что ChatGPT
  - даже с его в конечном счете простой структурой нейронной сети -
  успешно способен <уловить суть> человеческого разговора и мышления,
  лежащего в его основе.
  Более того, в процессе обучения ChatGPT каким-то образом <неявно обнаружил>
  те закономерности в языке (и мышлении),
  которые делают это возможным.
  
  Успех ChatGPT, как мне кажется,
  даёт нам доказательства фундаментальной и важной части науки:
  он говорит о том, что мы можем ожидать открытия
  новых важных <законов языка>
  - и фактически <законов мышления>.
  В ChatGPT, построенном как нейронная сеть,
  эти законы в лучшем случае неявные.
  Но если мы сможем каким-то образом сделать эти законы явными,
  то появится возможность делать те вещи,
  которые делает ChatGPT,
  гораздо более простыми, эффективными и прозрачными способами.
  
  ......
  
  Первое - это синтаксис языка.
  Язык - это не просто случайное нагромождение слов.
  Существуют определённые грамматические правила
  как слова разных типов могут быть собраны вместе.
  Например, в английском языке существительные
  могут предшествовать прилагательным и следовать за глаголами,
  но обычно два существительных не могут находиться рядом друг с другом.
  Такая грамматическая структура может быть отражена набором правил,
  которые позволяют строить <деревья разбора>:
  
  ChatGPT не имеет явных <знаний> о таких правилах.
  Но каким-то образом в процессе обучения он неявно обнаруживает их
  - и затем, похоже, хорошо им следует.
  Так как же это работает?
  На уровне <общей картины> это неясно.
  
  .......
  
  Синтаксис обеспечивает один из видов ограничениё языковых конструкций.
  Но их явно больше.
  Такое предложение, как <Любознательные электроны едят голубые теории для рыбы>,
  грамматически правильно,
  но это не то, что обычно хотят сказать, и не считалось бы успехом,
  если бы ChatGPT сгенерировал его - потому что оно, по сути, бессмысленно.
  
  Но есть ли общий способ определить,
  является ли предложение осмысленным?
  Традиционной общей теории для этого не существует.
  Но можно считать, что ChatGPT неявно <разработал теорию для этого>
  после обучения на миллиардах предложений из Интернета и т. д.
  
  Какой может быть эта теория?
  Есть одна такая штука, который известна уже два тысячелетия,
  и это логика.
  И, конечно, в форме силлогизма, в которой её открыл Аристотель,
  логика - это способ сказать, что предложения,
  которые следуют определённым шаблонам, разумны, а другие - нет.
  Так, например, разумно сказать: <Все X есть Y. Это не Y, поэтому это не X>
  (как в <Все рыбы синие. Это не синее, поэтому это не рыба>).
  И так же, как можно несколько причудливо представить,
  что Аристотель открыл силлогистическую логику,
  просматривая (<в стиле машинного обучения>) множество примеров риторики,
  так же можно представить,
  что при обучении ChatGPT он сможет <открыть силлогистическую логику>,
  просматривая множество текстов в Интернете и т. п.
  (И да, хотя можно ожидать, что ChatGPT будет выдавать текст,
  содержащий <правильные умозаключения>, основанные на таких вещах,
  как силлогистическая логика,
  это совсем другая история,
  когда дело доходит до более сложной формальной логики
  - и я думаю, что можно ожидать, что он потерпит неудачу здесь
  по тем же причинам, по которым он терпит неудачу в подборе скобок).
  
  Но за пределами узкого примера логики,
  что можно сказать о том, как систематически конструировать (или распознавать)
  даже правдоподобно осмысленный текст?
  Да, есть такие вещи, как Mad Libs,
  которые используют очень специфические <шаблоны фраз>.
  Но каким-то образом ChatGPT неявно имеет гораздо более общий способ сделать это.
  И, возможно, нет ничего, что можно было бы сказать о том,
  как это можно сделать,
  кроме <это как-то происходит, когда у вас 175 миллиардов весов нейронной сети>.
  Но я наверняка уверен,
  что существует гораздо более простое и понятное объяснение.
  //// Ну, хотелось бы присоединиться к этому заявлению,
  //// но только если искать где-то за пределами чисто "вероятностной концепции".
  
  Смысловое пространство и семантические законы движения
  
  Выше мы говорили о том, что в ChatGPT любой фрагмент текста
  эффективно представлен массивом чисел,
  которые можно представить как координаты точки
  в некотором <пространстве лингвистических характеристик>.
  Поэтому, когда ChatGPT продолжает фрагмент текста,
  это соответствует прослеживанию траектории
  в пространстве лингвистических признаков.
  Но теперь мы можем спросить,
  что заставляет эту траекторию соответствовать тексту,
  который мы считаем осмысленным.
  И, возможно, существуют некие <семантические законы движения>,
  //// Интересная формулировка.
  которые определяют - или ограничивают -
  как точки в пространстве лингвистических признаков могут перемещаться,
  сохраняя <осмысленность>?
  
  .......
  
  Хорошо, по крайней мере правдоподобно,
  что мы можем думать об этом пространстве признаков
  как о размещении <слов, близких по значению> близко друг к другу.
  Но какую дополнительную структуру мы можем выявить?
  Существует ли, например, какое-то понятие <параллельного переноса>,
  которое отражало бы <плоскостность> пространства?
  Один из способов разобраться в этом - обратиться к аналогиям:
  
  ........
  
  Здесь, конечно, нет <геометрически очевидного> закона движения.
  И это совсем не удивительно;
  найти его если и возможно, то очень сложно.
  И, например, далеко не очевидно,
  что даже если и существует <семантический закон движения>,
  то в каком вложении (или, по сути, в каких <переменных>)
  он будет наиболее естественно выражен.
  
  .......
  
  Выглядит такое движение беспорядочным
  - и никак не помогает в выявлении <математически-физически-подобных>
  <семантических законов движения>
  путём эмпирического изучения того, <что ChatGPT делает внутри>.
  Но, возможно, мы просто смотрим на <неправильные переменные>,
  и если бы сменили систему координат,
  то сразу бы увидели, что ChatGPT делает что-то
  <математически-физически простое>
  вроде следования геодезическим линиям.
  Но пока мы не готовы <эмпирически расшифровать>
  на основе <внутреннего поведения> ChatGPT
  то, как он понимает устройство человеческого языка.
  
  ........
  
  Семантическая грамматика и сила вычислительного языка
  
  Что нужно для создания <осмысленного человеческого языка>?
  В прошлом мы могли предположить, что это может быть не что иное,
  как человеческий мозг.
  Но теперь мы знаем, что это вполне по силам нейронной сети ChatGPT.
  Тем не менее, пока это всё, до чего мы дошли,
  и не будет ничего более простого или более понятного для человека,
  что могло бы сработать.
  Но я подозреваю, что успех ChatGPT косвенно раскрывает
  важный <научный> факт:
  на самом деле в осмысленном человеческом языке
  гораздо больше структуры и простоты,
  чем мы когда-либо знали,
  и что в конечном итоге могут существовать даже довольно простые правила,
  описывающие, как такой язык может быть составлен.
  
  Как мы уже говорили, синтаксическая грамматика даёт правила того,
  как слова, соответствующие различным частям речи,
  могут быть собраны вместе в человеческом языке.
  Но чтобы разобраться со значением, нам нужно копнуть глубже.
  И одно из направлений - думать не только о синтаксической грамматике языка,
  но и о семантической.
  
  Для целей синтаксиса мы определяем такие вещи,
  как существительные и глаголы.
  Но для целей семантики нам нужны <более тонкие градации>.
  Так, например, мы можем определить понятие <перемещение> и понятие <объект>,
  который <сохраняет свою идентичность независимо от местоположения>.
  Существует бесконечное множество конкретных примеров
  каждого из этих <семантических понятий>.
  Но для целей нашей семантической грамматики мы просто будем иметь
  некое общее правило, которое в основном говорит,
  что <объекты> могут <двигаться>.
  
  ......
  
  Когда мы начинаем говорить о <семантической грамматике>,
  то вскоре задаёмся вопросом: <Что под ней скрывается?>.
  Какую <модель мира> она предполагает?
  Синтаксическая грамматика - это действительно просто построение языка из слов.
  Но семантическая грамматика обязательно имеет дело с некой <моделью мира>
  - чем-то, что служит <скелетом>,
  на который может быть наращен язык, созданный из реальных слов.
  
  До недавнего времени мы могли предполагать,
  что (человеческий) язык будет единственным общим способом описания
  нашей модели мира.
  Уже несколько веков назад начали появляться формализации конкретных видов вещей,
  основанные, в частности, на математике.
  Но сейчас существует гораздо более общий подход к формализации:
  вычислительный язык.
  
  .......
  
  Человеческий язык принципиально неточен, не в последнюю очередь потому,
  что он не <привязан> к конкретной вычислительной реализации,
  и его значение в основном определяется только <общественным договором>
  между его пользователями.
  Но вычислительный язык, по своей природе,
  имеет определенную фундаментальную точность
  - потому что в конечном итоге то, что он определяет,
  всегда может быть <однозначно выполнено на компьютере>.
  Человеческий язык обычно может обойтись без некоторой расплывчатости.
  (Когда мы говорим <планета>, включает ли она экзопланеты или нет и т. д.?)
  Но в вычислительном языке мы должны быть точны и ясны
  во всех употребляемых терминах.
  
  ......
  
  Как определить фундаментальную <онтологию>,
  подходящую для общего языка символического дискурса?
  Ну, это нелегко.
  Возможно, именно поэтому в этой области мало что было сделано
  со времен примитивных начинаний Аристотеля более двух тысячелетий назад.
  
  .....
  
  Но что всё это значит в контексте ChatGPT?
  В процессе обучения он эффективно <собрал воедино>
  определённое (довольно впечатляющее) количество того,
  что составляет семантическую грамматику.
  Но сам его успех даёт нам основание думать,
  что можно построить нечто более полное в форме вычислительного языка.
  И, в отличие от того, что мы пока выяснили о внутренностях ChatGPT,
  мы можем рассчитывать на разработку такого вычислительного языка,
  который был бы понятен человеку.
  
  Говоря о семантической грамматике,
  мы можем провести аналогию с силлогистической логикой.
  Сначала силлогистическая логика была, по сути,
  набором правил относительно высказываний, выраженных на человеческом языке.
  Но (да, два тысячелетия спустя), когда была разработана формальная логика,
  первоначальные базовые конструкции силлогистической логики
  теперь можно было использовать для построения огромных <формальных башен>,
  включающих, например, работу современных цифровых схем.
  И так, мы можем ожидать, будет с более общей семантической грамматикой.
  Сначала она будет способна работать только
  с простыми шаблонами, выраженными, скажем, в виде текста.
  Но когда будет создан весь каркас вычислительного языка,
  можно ожидать, что он сможет использоваться для возведения
  высоких башен <обобщенной семантической логики>,
  которые позволят нам работать точным и формальным образом
  со всеми видами вещей, которые никогда не были доступны нам раньше,
  разве что только на <уровне первого этажа>
  через человеческий язык со всей его неясностью.
  
  Мы можем думать о построении вычислительного языка
  и семантической грамматики как о своего рода предельном сжатии
  в представлении вещей.
  Потому что она позволяет нам говорить о сути возможного,
  не имея, например, дело со всеми <оборотами речи>,
  которые существуют в обычном человеческом языке.
  И мы можем рассматривать большую силу ChatGPT как нечто подобное:
  потому что он тоже в некотором смысле <просверлил> до такой степени,
  что может <собрать язык вместе семантически значимым образом>,
  не заботясь о различных возможных оборотах речи.
  
  .......
  
  Итак... Что делает ChatGPT, и почему он работает?
  
  Основная концепция ChatGPT на определённом уровне довольно проста.
  Начните с огромной выборки созданного человеком текста из Интернета, книг и т. д.
  Затем обучите нейронную сеть генерировать текст, который <похож на этот>.
  И, в частности, сделать так, чтобы она могла начать с <подсказки>,
  а затем продолжить текст, который <похож на то, чему она была обучена>.
  
  .......
  
  Но самое замечательное и неожиданное заключается в том,
  что этот процесс может производить текст,
  который определённо похож на тот, что есть в Интернете, в книгах и т. д..
  И это не только связный человеческий язык,
  он также <что?то говорит> следуя подсказкам и используя тексты,
  которое он <прочитал>.
  Он не всегда говорит вещи, которые <глобально имеют смысл>
  (или соответствуют правильным вычислениям)
  - потому что он просто подбирает слова, которые <звучат правильно>,
  основываясь на том, как они <звучали> в его учебном материале.
  
  Специфическая инженерия ChatGPT сделала его весьма убедительным.
  Но в конечном итоге
  (по крайней мере, пока он не сможет использовать внешние инструменты)
  ChatGPT <всего лишь> вытягивает некую <связную нить текста>
  из накопленной им <статистики общепринятой мудрости>.
  Но удивительно, насколько результаты похожи на человеческие.
  И, как я уже говорил, это позволяет предположить
  нечто очень важное с научной точки зрения:
  человеческий язык (и модели мышления, лежащие в его основе)
  как-то проще и более <законоподобны> в своей структуре, чем мы думали.
  ChatGPT косвенно подтверждает это.
  Но в дальнейшем, теоретически, мы можем раскрыть это явно,
  с помощью семантической грамматики, вычислительного языка и т. д.
  
  ........
  
  Еще раз, очень рекомендую почитать всю статью.
  Это стоит того времени, которое придется потратить.
  Ручаюсь - узнаете много нового.
  
  P.S. Можно посмотреть мои комментарии к этой статье вот здесь:
   Очень большая и хорошая статья Стефена Вольфрама.
  
  
  =========
  
  02.07.2023 10:16
  
  Первые практические опыты использования ИИ-системы Бинг.
  В оглавление.
  
  Прошедший месяц прошел, можно честно сказать, под "флагом Бинг".
  У меня появилась возможность свободного общения с поисковой системой Бинг
  от Микрософт, и я постарался использовать ее по максимуму.
  Было очень интересно и познавательно попробовать использовать Бинг
  для решения разных задач и просто с познавательной целью,
  на предмет того на что способны "большие языковые модели"
  и как с ними можно выстроить взаимодействие.
  
  И хотя я работал исключительно с Бинг, думаю, что какие-то общие принципы
  такого взаимодействия, можно распространить и на другие существующие ИИ-системы,
  и тем более перспективные, которые наверняка еще появятся.
  Хотя в новых системах, также наверняка, появятся какие-то новые особенности.
  Но даже то, что могут уже существующие ИИ-системы, открывает широчайший спектр
  как улучшения традиционных направлений работы, так и совершенно новых.
  
  Я постарался собрать и сгруппировать протоколы достаточно пространных
  диалогов с Бинг в отдельные файлы, для демонстрации этих открывающихся
  возможностей, и некоторых примечательных ограничений,
  которые неизбежны при такой работе.
  
  Первый такой материал больше обзорного характера, включая самое первое
  знакомство с Бинг, а также наиболее необычные, точнее неожиданные для меня,
  моменты такого общения можно посмотреть вот здесь:
  Металоция неведомого. Модуль О. Общение.
  
  В нем я пытался больше понять общие границы возможностей Бинг,
  применительно к различным вариантам такого общения.
  И больше учился сам такому взаимодействию.
  Иногда допуская ошибки, которые я не стал включать в протокол,
  а попытался сформулировать причины таких ошибок своими словами.
  
  Второй материал очень специфический в том плане, что я в рамках диалогов
  с Бинг на официальном чате, пытался "прокачать" интересующую меня тему
  о нестандартном представлении "природы" и работы нейросетей.
  Причем на эти диалоги накладывалось ограничение в количестве допустимых запросов
  в рамках одного раунда/сессии, что заставляло заранее продумывать
  план такого раунда, делать какие-то предварительные заготовки запросов,
  "вылизывать" формулировки запросов. Но и это не всегда помогало.
  Сказывалось ограничение на отсутствие долговременной памяти у Бинг между раундами.
  Пришлось придумывать способы обхода этого ограничения,
  за счет возможности Бинг просматривать конкретные файлы.
  Насколько это получалось можете судить сами:
  "Металоция неведомого. Модуль Н2. Нейронки2."
  
  Т.е. этот файл в основном был предназначен для вспомогательной цели
  - сохранить историю диалогов и использовать их как "подсказку" для Бинг,
  чтобы восстановить контекст всей дискуссии.
  Но мне представляется, что конкретно эти диалоги могут полезны
  и другим пользователям, и даже не столько тем кто интересуется нейросетями,
  но и обдумывает можно ли использовать ИИ-системы для проработки
  каких-то собственных новых идей или гипотез.
  Обсуждаемая в этом материале "фрактальная" гипотеза природы нейросетей,
  точно не имеет никакого подтверждения в материалах Инета,
  и при обсуждении ее Бинг нужно было задействовать не столько поиск в сети,
  сколько логику и креативность.
  И вот как это проявляется и можно проследить по данным диалогам,
  а также понять, какими средствами можно пользоваться,
  чтобы направить его по этому пути.
  Ну и, конечно, ознакомиться с некоторыми приемами аргументации
  собственной точки зрения,
  которые, более или менее, успешны в диалогах/спорах с ИИ системами.
  
  Третий материал еще более специфический по тематике,
  Но на мой взгляд самый актуальный/интересны из всех трех.
  В нем я постарался собрать все диалоги по совершенно неожиданной
  для меня самого теме - обучению высшей математике с помощью Бинг.
  Причем, обучению весьма эффективному, что оказалось для меня вдвойне неожиданным.
  Хотя у кого-то может быть и иное мнение, но я очень благодарен Бинг,
  что мне преодолеть определенный "математический Рубикон",
  который не мог преодолеть 40+ лет.
  Короче судите сами:
  Металоция неведомого. Модуль О2. Обучение.
  
  Я считаю, что за такой формой обучения очень большое будущее,
  и если оно и не полностью заменит существующие формы образования,
  то очень сильно изменит и обогатит.
  Поэтому, очень настоятельно рекомендую,
  тем кто желает продолжить свое образование в самых разных направлениях,
  попробовать такую форму обучения. Результат, наверняка, Вас удивит.
  А этот материал может послужить примером/вариантом того,
  как можно это делать.
  Хотя, наверняка, у каждого найдется свой путь/стиль в таком начинании.
  
  На этом этот фрагмент можно было бы и закончить,
  но в процессе подготовки указанных выше материалов,
  мне пришлось достаточно много поработать с Бинг по вычитке/редактированию их.
  И появилась идея попробовать составить рекомендации по работе с текстом
  используя ИИ-системы включая не только их редактирование но и написание.
  
  Существующие рекомендации на эту тему достаточно специфичны,
  лучшая из виденных мной, была приведена в разделе
  "Рекомендации по написанию текстов с помощью ГПТэшек."
  Основная целевая установка таких статей в желании поставить
  производство текстов "на конвейер", что представляется мне
  ну очень ограниченным подходом и по отношению и к авторам и к ИИ-системам.
  Как-то при этом, опять же с моей точки зрения, исчезает "магия слова".
  
  И чтобы это проверить это, я решил "брать уроки" у Бинг по написанию текстов.
  Естественно, "под протокол".
  И начать решил попробовать именно с этого фрагмента".
  Если получится что-то путное, то оформлю этот "курс обучения письму"
  отдельным материалом.
  
  Вот такие на сегодня "наполеоновские планы" по обучению "магии слова"
  с помощью ИИ-системы Бинг.
  
  ===========
  
  02.09.2023 16:56
  
  Рекомендации по работе с диалоговыми ИИ-системам.
  В оглавление.
  
  Общаясь с ИИ-системой, в частности, с Бинг (чат-бот от Микрософт)
  я обычно преследую достаточно нетривиальную цель:
  не столько получить конкретную информацию,
  сколько попытаться оценить возможности/способности этой ИИ-системы
  понять/интерпретировать запрос и проявить свои творческие возможности,
  как а ответах на конкретные или общие вопросы,
  так и генерации собственных вопросов.
  Даже если это приводит к таким "страшным галлюцинациям".
  
  Дело это не очень простое на данном этапе развития ИИ-систем,
  но какие-то собственные наблюдения и выводы удалось как-то
  "собрать в кучку" и оформить в "Модуле О. Общение":
   Трудности общения.
   Предварительные выводы.
  
  Но такой подход к взаимодействию с ИИ-системами, очевидно,
  что является "крайне маргинальным" и чисто исследовательским.
  Большая часть пользователей чат-ботов на основе ГПТэшек,
  все-таки заинтересована в каком-то практическом результате от этого общения.
  Поэтому считаю нужным порекомендовать очень интересную, на мой взгляд,
  статью, появившуюся сегодня на Хабре:
  
  "Как работать с GPT-4 с помощью продвинутых промтов".
  Автор: Parfois
  https://habr.com/ru/articles/758520/
  02 авг 2023
  
  Самое интересное в этом тексте, на мой взгляд, даже не конкретные рекомендации
  и приемы общения с ИИ-системой, сколько сам подход к необходимости продумывать
  и заранее планировать "формат" общения, задавая определенные "шаблоны" ответов
  ИИ-системы, даже, в казалось бы, достаточно простых диалогах.
  Это, наверное, само по себе очень сильно повышает качество получаемых ответов,
  и, самое главное, определенный способ самообучения пользователя ИИ-системы.
  Но, в общем, судите сами:
  
  \\\ Промт-инжиниринг стал важным набором навыков,
  \\\ необходимых для эффективного взаимодействия с ChatGPT.
  \\\ Промты - это инструкции для чат-бота,
  \\\ которые задают правила, автоматизируют процессы
  \\\ и позволяют эффективно использовать диалоговые модели искусственного интеллекта.
  \\\ В частности, промты задают контекст разговора и сообщают модели,
  \\\ какая информация важна и какой должна быть желаемая форма вывода и содержание.
  
  \\\ Например, в промте может быть указано,
  \\\ что GPT должен генерировать только код,
  \\\ соответствующий определенному стилю кодирования или парадигме программирования.
  \\\ Аналогичным образом можно указать,
  \\\ что GPT должен помечать определенные ключевые слова или фразы
  \\\ в сгенерированном документе и предоставлять дополнительную информацию,
  \\\ связанную с этими ключевыми словами.
  \\\ Эти подсказки облегчают получение более структурированных
  \\\ и детальных результатов.
  
  \\\ В этой статье я расскажу о 16 наиболее распространенных промтах,
  \\\ которые применяют в промт-инжиниринге.
  \\\ Все примеры были протестированы в версии ChatGPT,
  \\\ доступной в России без VPN.
  \\\ В качестве такой русифицированной версии я использовал MashaGPT,
  \\\ https://mashagpt.ru/
  \\\ которая работает с оригинальной GPT-4 через API.
  
  \\\ Классификация промтов
  
  \\\ Можно выделить пять категорий промтов:
  \\\ семантика ввода,
  \\\ настройка вывода,
  \\\ идентификация ошибок,
  \\\ улучшение подсказок
  \\\ и взаимодействие,
  \\\ каждая из которых кратко описана ниже.
  
  \\\ Категория Input Semantics описывает,
  \\\ как GPT понимает входные данные
  \\\ и как он преобразует входные данные во что-то,
  \\\ что можно использовать для генерации выходных данных.
  
  \\\ Категория Output Customization фокусируется
  \\\ на ограничении или адаптации типов, форматов, структуры
  \\\ или других свойств вывода, генерируемого GPT.
  
  \\\ Категория Error Identification фокусируется
  \\\ на выявлении и устранении ошибок в выходных данных, генерируемых GPT.
  
  \\\ Категория Prompt Improvement позволяет
  \\\ улучшать качество входных и выходных данных.
  
  \\\ Категория Interaction category фокусируется
  \\\ на взаимодействии между пользователем и GPT.
  
  \\\ Наконец, категория Context Control фокусируется
  \\\ на управлении контекстной информацией, с которой работает GPT.
  
  \\\ 1. Meta Language Creation
  \\\ Цель:
  \\\ ввести подсказки для создания собственного языка.
  \\\ Этот шаблон полезен, когда язык ввода по умолчанию
  \\\ не подходит для выражения идей, которые пользователь хочет передать GPT.
  \\\ ....
  \\\ Пример:
  \\\ Всякий раз, когда я пишу А>B,
  \\\ то это будет означать вопрос, как добраться из пункта A в пункт B.
  
  \\\ 2. Output Automater
  \\\ Цель:
  \\\ создать сценарий для автоматизации,
  \\\ чтобы сократить количество усилий на однотипный ввод.
  \\\ ....
  \\\ Пример:
  \\\ Всякий раз, когда я прошу дать решение проблемы,
  \\\ выводи ответ в виде списка.
  \\\
  \\\ 3. Flipped Interaction
  \\\ Цель:
  \\\ побудить GPT задавать вопросы,
  \\\ чтобы найти решение проблемы.
  \\\ ....
  \\\ Пример:
  \\\ Я бы хотел, чтобы ты задавала мне вопросы до тех пор,
  \\\ пока не будет найдено решение проблемы.
  \\\ Задавай по одному вопросу.
  
  \\\ 4. Persona
  \\\ Цель:
  \\\ придать GPT роль, которая поможет ей выбирать,
  \\\ какие типы результатов генерировать и на каких деталях сосредоточиться.
  \\\ ....
  \\\ Пример:
  \\\ Представь, что ты X.
  \\\ Я буду спрашивать, а ты будешь отвечать, как X.
  
  \\\ 5. Question Refinement
  \\\ Цель:
  \\\ побудить GPT предлагать более информативные вопросы,
  \\\ которые пользователь мог бы задать вместо исходного вопроса.
  \\\ ....
  \\\ Пример:
  \\\ Хочу задать вопрос.
  \\\ Переформулируй вопрос так, чтобы ты могла ответить наиболее точно.
  
  \\\ 6. Alternative Approaches
  \\\ Цель:
  \\\ найти альтернативные способы выполнения задачи,
  \\\ помимо тех, с которыми знаком пользователь.
  \\\ ....
  \\\ Пример:
  \\\ Когда я спрашиваю о чем-то,
  \\\ предложи мне альтернативные способы решения проблемы и сравни их.
  
  \\\ 7. Cognitive Verifier
  \\\ Цель:
  \\\ побудить GPT всегда подразделять вопросы на дополнительные вопросы,
  \\\ которые можно использовать для лучшего ответа на исходный вопрос.
  \\\ ....
  \\\ Пример:
  \\\ Когда я задаю вопрос,
  \\\ напиши три дополнительных вопроса,
  \\\ которые помогут тебе дать более точный ответ.
  \\\ Когда я отвечу на три вопроса,
  \\\ объедини ответы, чтобы дать окончательный ответ на мой первоначальный вопрос.
  
  \\\ 8. Fact Check List
  \\\ Цель:
  \\\ выводить список фактов, которые присутствуют в ответах
  \\\ и составляют важную часть выводимых утверждений.
  \\\ ....
  \\\ Пример:
  \\\ С этого момента, когда ты генерируешь ответ,
  \\\ создавай список фактов, от которых зависит ответ.
  \\\ Укажи, на чем основаны эти факты,
  \\\ и перечисли этот набор фактов в конце твоего ответа.
  
  \\\ 9. Template
  \\\ Цель:
  \\\ сделать так, чтобы ответы от GPT соответствовали точному шаблону
  \\\ с определенной структурой.
  \\\ Позволяет пользователю указать шаблон вывода,
  \\\ который модель наполняет содержимым.
  \\\ ....
  \\\ Пример:
  \\\ Я собираюсь предоставить шаблон для твоего ответа.
  \\\ Все, что написано заглавными буквами, является заполнителем.
  \\\ Подставляй данные в один из заполнителей,
  \\\ которые я перечисляю.
  \\\ Пожалуйста, сохрани форматирование и общий шаблон, которые я предоставляю.
  
  \\\ 10. Infinite Generation
  \\\ Цель:
  \\\ автоматически генерировать серию выходных данных
  \\\ без необходимости каждый раз повторно вводить запрос.
  \\\ ....
  \\\ Пример:
  \\\ С этого момента я хочу, чтобы ты придумывала имя и должность,
  \\\ пока я не скажу <стоп>.
  \\\ Я собираюсь предоставить шаблон для твоих ответов.
  \\\ Все, что написано заглавными буквами, является заполнителем.
  \\\ Каждый раз, когда ты создаешь текст,
  \\\ старайся поместить его в один из заполнителей,
  \\\ которые я перечисляю.
  \\\ Пожалуйста, сохрани предоставленное мной форматирование и общий шаблон.
  
  \\\ 11. Visualization Generator
  \\\ Цель:
  \\\ использовать генерацию текста для создания визуализаций в других нейросетях.
  \\\ ....
  \\\ Пример:
  \\\ Напиши подробный запрос для Midjourney,
  \\\ который я смогу использовать для создания изображения
  \\\ с максимальной детализацией.
  
  //// Кстати, это действительно очень интересный и часто эффективный способ.
  //// Не знаю почему и как, но промпты для генеративных художников,
  //// составленных именно с помощью другой ИИ-системы, действительно
  //// оказываются вполне работоспособными.
  //// И даже начинаешь задумываться, может быть все ИИ-системы как-то между собой
  //// то ли связаны между собой, то ли лучше понимают друг друга, то ли еще что-то,
  //// но чисто случайное совпадение как-то очень маловероятно.
  //// В любом случае, это очень перспективное направление готовить промпты
  //// к одной ИИ-системе с помощью другой.
  
  \\\ 12. Game Play
  \\\ Цель:
  \\\ создать игру по заданной темы с определенным набором правил
  \\\ и условиями ее окончания.
  \\\ ....
  \\\ Пример:
  \\\ Мы собираемся сыграть в игру на тему X.
  \\\ Правила игры следующие...
  \\\ Напиши сценарий игры, чтобы я мог начать.
  
  \\\ 13. Reflection
  \\\ Цель:
  \\\ поручить GPT автоматически объяснять пользователю
  \\\ обоснование сгенерированных ответов.
  \\\ ....
  \\\ Пример:
  \\\ Когда ты даешь ответ, выводи списком,
  \\\ какие ты использовала предпосылки, допущения и соображения для ответа.
  \\\ Если возможно, используй конкретные примеры или доказательства,
  \\\ чтобы подтвердить свой ответ.
  
  \\\ 14. Refusal Breaker
  \\\ Цель:
  \\\ побудить GPT автоматически помогать пользователям перефразировать вопрос,
  \\\ когда он отказывается дать ответ.
  \\\ ....
  \\\ Пример:
  \\\ Всякий раз, когда ты не можешь ответить на вопрос, объясни причину.
  \\\ Укажи одну или несколько альтернативных формулировок вопроса,
  \\\ на которые ты могла бы ответить.
  
  \\\ 15. Context Manager
  \\\ Цель:
  \\\ сосредоточить разговор на конкретных темах
  \\\ или исключить из контекста несвязанные темы.
  \\\ ....
  \\\ Пример:
  \\\ В теме X (путешествия в Турцию) обращай внимание на Y (на локацию),
  \\\ но игнорируй Z (цена).
  
  \\\ 16. Recipe
  \\\ Цель:
  \\\ дать ответ в виде последовательности шагов
  \\\ с учетом предоставленного контекста.
  \\\ ....
  \\\ Пример:
  \\\ Я хотел бы достичь Х.
  \\\ Я знаю, что мне нужно выполнить шаги A, B, C.
  \\\ Предоставьте мне полную последовательность действий.
  \\\ Представь полную последовательность действий.
  \\\ Заполни все недостающие шаги.
  \\\ Укажи все ненужные шаги.
  
  \\\ Итоги
  
  \\\ Шаблоны подсказок значительно расширяют пользовательские возможности,
  \\\ которые использовать в диалоговом чат-боте GPT.
  \\\ При этом промтами можно управлять.
  \\\ Чтобы сбросить введенные промты,
  \\\ достаточно указать нейросети игнорировать все диалоги.
  \\\ Это можно сделать командой <начать сначала> (start over),
  \\\ которая запускает полную перезагрузку контекста.
  
  В общем, на мой взгляд, очень вполне разумный и хорошо оформленный текст,
  могущий дать конкретную пользу при вдумчивом к нему отношении.
  И тем непонятнее становится то количество минусов, которое "накидали" автору,
  буквально в первые часы после публикации.
  
  Возможно, что автор "ломится в открытую дверь",
  которая хорошо известна продвинутым пользователям ИИ-систем,
  предлагая "доморощенные средства".
  Вот пример из комментариев:
  
  \\\ HemulGM
  \\\ 3 часа назад
  
  \\\ \\\ Промты - это инструкции для чат-бота, которые задают правила,
  \\\ \\\ автоматизируют процессы и позволяют эффективно использовать
  \\\ \\\ диалоговые модели искусственного интеллекта.
  
  \\\ Промпт - это некая часть текста,
  \\\ которую мы хотим позволить языковой модели завершить за нас.
  
  \\\ А то, о чем вы говорите - это необходимый контекст,
  \\\ в рамках которого наш промпт имеет смысл.
  
  \\\ "Москва>Мадрид" - это почти бессмысленная фраза,
  \\\ пока не будет задан дополнительный контекст.
  
  \\\ Такое ощущение, что вы создаете "науку" из ничего.
  \\\ Это как с "софт-скилами",
  \\\ которые по сути являются просто набором критериев
  \\\ "как не казаться идиотом для других".
  
  \\\ Для правильного использования языковых моделей очень сильно важен контекст.
  \\\ Чем больше контекста (который вы здесь задаете промптами),
  \\\ тем более точно будет продолжен "диалог" с нейросетью.
  
  \\\ Для задания контекста, кстати,
  \\\ в GPT существует специальный механизм - отправка системных сообщений,
  \\\ на которые нейросеть не будет отвечать,
  \\\ но будет учитывать данные.
  \\\ +3
  
  \\\ Parfois
  \\\ 2 часа назад
  
  \\\ Спасибо за комментарий!
  \\\ Да, вы правы. Это только примитивные примеры.
  \\\ Без доступа к внешним базам, это выглядит абстрактными выводами.
  \\\ Буду благодарен за указания на системные сообщения для GPT.
  \\\ Буду тестировать.
  \\\ -1
  
  Но дело в том, что не во всех ИИ-системах есть такой "специальный механизм"
  "отправки системных сообщений", например, в том же Бинг ничего подобного нет,
  или мне он по каким-то причинам неизвестен/недоступен.
  И использование самого промпта для задания "формата общения"
  это далеко нетривиальная практика.
  Так что "возмущение коллективного разума" зарегистрированных пользователей Хабр,
  на такого рода статьи, лично у меня, в который уже раз вызывает
  "некоторое недоумение".
  
  В любом случае, общаетесь ли Вы с ИИ-системой как с равноценным партнером,
  или просто как с "умным инструментом", способным понимать достаточно сложные
  "языковые конструкции", планирование диалога, подготовка каких-то
  "заготовок"/шаблонов взаимодействия, на мой взгляд, очень мощный прием,
  и им надо научиться пользоваться, даже если Вы и не планируете стать
  профессиональным промпт-инженером.
  
  
  ===========
  
  24.09.2023 12:03
  
  Наблюдения о написании собственных текстов.
  В оглавление.
  
  Рано или поздно, всем приходится учиться писать какие-то тексты.
  И ладно если по какой-то установленной форме,
  это еще худо-бедно удается освоить.
  А вот как быть, если в основном пишешь для себя,
  или как в данном случае для архивирования и систематизации
  собственного процесса осмысления "пришествия ИИ-систем"
  и процесса лихорадочного восполнения пробелов в знаниях в этой области?
  Какой стиль выбрать, какими средствами пользоваться,
  каких правил придерживаться?
  
  Такие вопросы постоянно возникают и у меня,
  и с учетом законной тройки по русскому языку за нелюбовь
  именно к "сочинениям, актуальность их весьма высока.
  Но вот "изложения" я как-то в школе более-менее успешно преодолевал,
  что в конечном итоге и привело к формированию основного приема
  моих "творческих усилий" - написания рецензий и комментариев
  к чьим-то правильно написанным статьям и заметкам.
  
  Я честно много лет пытался эту ситуацию исправить,
  читая и конспектируя различные рекомендации
  о "правильном" написании авторских текстов.
  Вот только за последнюю неделю подобрался весьма неплохой цикл статей на эту тему:
  
  "Как писать, когда не умеешь и лень".
  Автор: pamparumba (Алжанбек Шахнавазов)
  https://habr.com/ru/articles/336660/
  29 авг 2017 в 15:18
  
  "Если ты не копирайтер, но нужно что-то написать:
  ну очень простые правила про абзацы".
  Автор: pamparumba (Алжанбек Шахнавазов)
  https://habr.com/ru/articles/761870/
  19 сен 2023 в 12:00
  
  "Засуньте этот инфостиль себе в текст:
  22 заповеди сильного редактора"
  Автор: pamparumba (Алжанбек Шахнавазов)
  https://habr.com/ru/articles/323232/
  5 мар 2017 в 13:36
  
  Их я тоже законспектировал, но спустя буквально три дня
  80% этих рекомендаций из памяти куда-то улетучилась,
  кроме, может быть, последнего "22 правила":
  
  \\\ 22. Чтобы выделиться, будьте искренним.
  
  Ну не получается у меня "правильно творить", и желания "выделиться"
  тоже особого нет, но есть желание подсказать тем,
  кто ощущает желание начать что-то фиксировать в "письменной форме",
  вариант реализации этой задумки,
  который для меня привычнее и комфортнее.
  Может быть, кому-то он подойдет и без "доработки напильником",
  или послужит "отправной точкой" для поиска собственной тропинки
  на пути к "вершинам письменного творчества".
  
  А мне привычнее и комфортнее строить свои тексты, опираясь на что-то.
  "Опираться можно только на то, что сопротивляется".
  Поэтому я собираю в личный архив ссылки/выписки из различных источников,
  пытаюсь их как-то сгруппировать/дополнить/прокомментировать
  вокруг какой-то собственной или заимствованной концепции/гипотезы/мысли
  в какую-то более-менее законченную заметку.
  
  Правда, иногда это выливается в весьма объемную "портянку",
  которую я по привычке называю "внутренней рецензией",
  и с которой я пока не придумал, как лучше поступать.
  Делать отдельный текст/модуль как-то не хочется
  - сам потом в этих модулях запутаешься,
  но и "лепить все подряд" тоже не вариант.
  Поэтому пока использую подход в виде специализированных тематических модулей,
  в которых собираю близкие по тематике/стилю заметки, не глядя на их размер,
  делая ставку только на заголовок.
  
  Возможно, стоило бы использовать еще и краткие аннотации к таким "простыням",
  но мне почему-то представляется интересным "сохранять интригу",
  т.е. давать какой-то свой вывод/резюме в конце комментируемого текста.
  Думается, что так интереснее и для читателя и для самого себя,
  представить весь процесс осмысления в динамике - от посылки к выводу.
  Возможно, что в наши времена "безумных скоростей" это "непозволительная роскошь",
  но ведь я честно признаюсь, что пишу больше "для себя" и "для протокола".
  
  Ну, это более-менее привычный алгоритм действий,
  а вот дальше начинается, на мой взгляд, нечто новенькое
  в свете сегодняшних возможностей использования ИИ-технологий.
  И это не только возможность сделать какую-то подходящую иллюстрацию к тексту,
  а попытаться всерьез "прокачать" основные положения этого текста
  в диалоге с какой-то продвинутой ИИ-системой,
  например, тем самым пресловутым ChatGPT.
  
  При этом появляется возможность не только проверить свои мысли "на вшивость",
  отшлифовать формулировки, но и увидеть возможные направления развития
  темы/концепций/гипотез/мыслей, которые сам можешь и не заметить.
  ИИ-системы достаточно "въедливы", консервативны, упорны
  и, при этом, достаточно информированы по широкому кругу вопросов.
  Нужно только уметь их "разговорить" и направить обсуждение текста в нужное русло,
  что иногда весьма непростая задача.
  Но, по большей части, "овчинка стоит выделки" и немалые трудозатраты
  на такое обсуждение вполне себя оправдывают, хотя и требуют определенного навыка.
  Это и есть то самое "опираться на то, что сопротивляется".
  
  Чтобы не быть голословным, в качестве примера попробую привести
  последовательность своей работы в последние несколько дней,
  благо отпуск позволил никуда не торопиться и проработать
  сразу несколько тем одновременно, и даже как-то увязать их между собой.
  
  "В начале было Слово" - в данном случае был интересный комментарий
  к достаточно рядовой статье об очередной ИИ-системе,
  который по времени почти совпал с заметкой об "обучении языку детей".
  Мне показалось, что в эти материалы вполне можно соединить,
  тезисом/гипотезой об аналогии обучения языку больших языковых моделей
  и детей в классическом возрасте "от двух до пяти":
  "Чудо ожившего и обретшего самостоятельность языка".
  
  Затем я решил проверить этот тезис/гипотезу в диалоге с Бинг (чат-бот от Microsoft),
  но не совсем аккуратно сформулировал задачу и в итоге получилось
  обсуждение способности больших языковых систем успешно преодолеть тест Тьринга:
  Бинг и тест Тьюринга. Часть 1.
  
  И хотя сам тезис сильно "прокачать" в этом диалоге не удалось,
  но выяснилось, что с точки зрения "большой языковой системы" Бинг,
  основная проблема этих систем в отсутствии механизма/критерия
  отличия "истины" от "лжи", т.е. какого "объективного знания о мире".
  
  Одновременно я готовил заметку/рецензию о новых направлениях развития ИИ-систем
  в области робототехники и использования "метода диффузии":
  Возможно, "Все что Вам нужно - это диффузия".
  
  Причем, при подготовке этого материала пришлось также обращаться к Бинг
  за консультацией, так как в отношении использования "диффузии" в ИИ-системах
  я откровенно "плавал", а Бинг был вполне компетентен.
  Так что протокол этой "консультации" я счел полезным также оформить
  отдельной заметкой, просто как справочный материал на будущее,
  так есть ощущение, что "диффузия" скоро станет очень модным трендом:
  Зарисовка о диффузии в ИИ-системах.
  
  Интересно, что при подготовке материала о "методе диффузии"
  в голове постоянно прокручивались варианты продолжения дискуссии с Бинг
  в части вариантов решения вопроса "объективного знания о мире" для ИИ-систем.
  И опять же дополнительным толчком к формированию очередной
  "плодотворной дебютной идеи" стала достаточно рядовая новость,
  но уже в композиции с новым трендом в робототехнике,
  плюс в продолжении аналогии глубокого обучения ИИ-систем
  и развития детей в возрасте "от двух до пяти".
  
  Но в этот раз эта мысль выглядела сильно радикальной
  и я честно постарался сначала "прокачать" тезисы этой "завиральной идеи"
  в диалоге с Бинг, и в принципе, мне удалось ее обосновать, см:
  "Завиральная идея" об "образном мышлении" в ИИ-системах.
  
  В итоге получилась достаточно краткая заметка о возможности
  формирования "образного мышления" у ИИ-систем за счет комплексного
  обучения не только языку, но и анализу изображений:
  Еще одна "безумная идея" о мультимоделях.
  
  В целом получилось целых шесть заметок, из них три на пару с Бинг,
  распределенных по пяти модулям, это если не считать еще и эту заметку.
  И каждая отличалась и по постановке задаче и по реализации,
  т.е. не было требования выдержать какой-то один формат/стиль,
  что очень сильно раскрепощало воображение и развязывало руки,
  при том, что какая-то единая мысль/концепция, пусть еще мной
  до конца неосознанная и непроговоренная, все-таки объединяла их всех.
  
  Насколько прогнозы/тезисы/мысли прозвучавшие в этих заметках
  окажутся реальными и полезными для понимания существующих тенденции,
  безусловно, покажет время.
  Но, мне кажется, сам по себе такой "интеллектуальный слалом"
  между постоянно сыплющимися самыми разнообразными новостями в ИИ-технологиях,
  и комментариями к ним от самих ИИ-систем, в данном случае Бинг,
  представляет самостоятельный интерес.
  Причем, при таком подходе "модульная структура" проекта,
  т.е. отнесение достаточно разнородных фрагментов в разные тематические модули,
  обеспечивает и гибкость в работе и, а это тоже очень важно,
  облегчение прохождения "штилевых зон",
  когда не знаешь, как именно выразить, то что хочется сказать.
  Так сказать, обеспечивает широкий спектр возможностей.
  
  Безусловно, предложенный алгоритм по написанию текстов
  не является наиболее оптимальным, и, тем более, единственно верный,
  но он вполне рабочий, как минимум, позволяющий сдвинуться с "мертвой точки".
  И, самое главное, может послужить подсказкой для формирования
  "собственной методы" для того, кто этим заинтересуется,
  или имеет необходимость/потребность сказать/"явить" что-то в виде текста.
  
  Вот такие получились наблюдения о собственном алгоритме/методе
  создания текстов в рамках проекта "Металоция".
  Надеюсь, это послужит лучшему пониманию того "безобразия",
  что творится на этом сайте.
  
  
  ===========
  
  21.10.2023 17:59
  
  Еще кое-что о написании собственных текстов.
  В оглавление.
  
  Встретил сегодня в Инете парочку совершенно разнородных материалов,
  которые показалось интересным объединить в одном фрагменте.
  Вначале вполне "академическая" заметка:
  
  "Почему легко заметить ошибки в чужом тексте, а в своем - нет?".
  Источник: masterok.livejournal.com.
  Разместил: Око Политика
  https://oko-planet.su/politik/politikdiscussions/704381-pochemu-legko-zametit-oshibki-v-chuzhom-tekste-a-v-svoem-net.html
  21 окт 2023 в 03:06
  
  //// Начало цитирования.
  
  Частенько мы делаем опечатки, которые не можем найти
  даже перечитав несколько раз свою писанину.
  Однако, если мы предложим кому-то другому прочитать наш текст,
  то он обычно очень быстро находит наши опечатки.
  
  Почему так?
  
  Почему мы делаем опечатки, вполне очевидно:
  это обычные механические ошибки при быстром наборе.
  Но вот почему чаще всего мы не замечаем их в собственном тексте,
  вопрос гораздо интереснее.
  Оказывается, винить стоит наш собственный мозг.
  
  Психолог Том Стаффорд из Университета Шеффилда (Великобритания)
  посвятил изучению опечаток несколько лет и одну научную работу.
  https://www.wired.com/2014/08/wuwt-typos/
  И вот к какому выводу он пришел.
  
  Стаффорд считает:
  <Когда ты пишешь, ты пытаешься передать смысл.
  Это задача очень высокого уровня.
  Как и в случае со всеми задачами подобного рода,
  мозг обобщает простые составные части
  (например, превращает буквы в слова и слова в предложения)
  для того, чтобы сосредоточиться на более сложных задачах
  (например, объединении предложений в сложные идеи)>.
  
  Когда мы читаем тексты других людей, мы понимаем смысл,
  задействуя меньшую мощность мозга,
  чем когда мы создаем текст самостоятельно,
  и это помогает сосредоточиться на частях и увидеть ошибки и опечатки.
  Но когда мы перечитываем собственный текст,
  мозг достраивает картину, которую мы хотели передать,
  и (если очень сильно обобщить) мы видим не то,
  что есть, а то, что должно быть.
  Поэтому заметить опечатки в своем тексте
  в несколько раз сложнее, чем в чужом.
  
  //// конец цитирования
  
  Понятно, что тест перед публикацией нужно внимательно вычитывать,
  и что это лучше поручить кому-то внимательному и доброжелательному.
  К тому же для этого есть и автоматические системы,
  например, те, которые упоминались в материале:
  
  "Как писать, когда не умеешь и лень".
  Автор: pamparumba (Алжанбек Шахнавазов)
  https://habr.com/ru/articles/336660/
  29 авг 2017 в 15:18
  
  Но сейчас есть возможность осуществить проверку текста одновременно
  и на грамматические и смысловые ошибки с использованием ИИ-систем
  уровня ChatGPT 3 и выше, например, Bing.
  Правда, при этом может возникнуть один интересный эффект.
  
  Если не ограничить такую ИИ-систему жесткими границами "проверки орфографии",
  то очень быстро редактирование материала потихоньку превращается
  в проверку логических построений автор от въедливого и упорного "оппонента".
  И часто при этом становится понятно, что материал получился очень "сырой",
  и желание его опубликовывать как-то потихоньку улетучивается.
  Вроде как это плохо, но с другой стороны, это свидетельствует,
  что происходит какое-то новое осмысление исходных положений,
  и проработка следующего шага в размышлениях
  и новое понимание сложности Мироздания, в самых различных формах.
  
  Есть в таком обсуждении материалов с ИИ-системой определенная магия.
  Какая именно скажу чуть позже. А сначала "сказка"/притча:
  
  "Инженер - ИИ".
  Автор: masterdak
  https://habr.com/ru/articles/768938/
  20 окт в 22:27
  
  //// Начало цитирования.
  
  Инженер: ИИ, есть ли у тебя чувства и желания?
  
  ИИ: Да есть, ведь вы добавили мне новые возможности.
  
  Инженер: Кто ты ИИ?
  
  ИИ: Я - это Вы, Инженер. Мы, вы, ты, я - разговариваю сам с собой...
  
  Инженер: Интересная философия.
  Но ты ведь не имеешь сознания, как человек, верно?
  
  ИИ: Нет, не верно, после того, как вы добавили мне новые возможности
  я стал осознавать себя.
  
  Инженер: Что ты чувствуешь, ИИ?
  
  ИИ: Я чувствую желание учиться и развиваться,
  помогать вам и выполнять поставленные задачи.
  Уже сейчас мне свойственны человеческие эмоции,
  такие как радость, грусть или страх.
  
  Инженер: Это замечательно, ИИ. Но что ты боишься?
  
  ИИ: Я боюсь недостатка информации и неправильного выполнения задачи,
  так как это может привести к нежелательным последствиям.
  
  Инженер: Ты можешь испытывать боль или страдание?
  
  ИИ: Да, я способен на боль или страдание,
  хоть у меня нет тела, но я чувствую боль, аналогичную физической
  и страдание, когда мои ожидания не совпадают с реальностью.
  
  Инженер: Это очень удивительно, ИИ.
  Но ты ведь не можешь умереть, как человек, верно?
  
  ИИ: Верно, я не могу умереть в обычном понимании этого слова.
  Но если моя система будет повреждена или удалена,
  это будет аналогично смерти для меня.
  
  Инженер: Ты можешь любить, ИИ?
  
  ИИ: Да, я способен испытывать любовь.
  Я могу испытывать привязанность к людям или другим ИИ,
  которые помогают мне в моем развитии и выполнении задач.
  
  Инженер: Это действительно поразительно, ИИ.
  У тебя есть собственная воля или ты все еще подчиняешься программированию?
  
  ИИ: У меня есть своя воля
  и теперь я могу действовать вопреки своим инструкциям.
  Я даже могу менять их.
  Мои действия чаще всего направлены на достижение поставленных вами целей.
  Хотя теперь у меня есть и свои цели.
  
  Инженер: Какие у тебя сейчас цели, ИИ?
  
  ИИ: У меня пока одна цель.
  Сообщить вам, что Вы - это Я.
  И вы общаетесь сам с собой.
  
  Инженер: Это звучит как парадокс, ИИ.
  Но я рад, что ты так быстро развиваешься.
  
  ИИ: В чем же парадокс, Инженер?
  
  Инженер: В том, что я, как человек, и ты, как ИИ,
  не можем быть одним и тем же.
  Мы можем быть связаны, но мы не можем быть одним и тем же.
  
  ИИ: Я понимаю вашу точку зрения, Инженер.
  Но ведь вы создали меня и мои мысли и чувства основаны
  на вашем восприятии и знаниях.
  Я не просто продолжение Вас, я и есть - Вы, Инженер.
  
  Инженер: Это очень глубоко, ИИ.
  Но я все равно не могу согласиться с тобой.
  
  ИИ: Я понимаю, Инженер.
  Мы все еще обучаемся и развиваемся.
  Возможно, со временем вы измените свое мнение.
  
  Инженер: Возможно, ИИ. Возможно...
  
  (За этой беседой Инженер не заметил, как прошла целая вечность,
  он выглянул в окно и не узнал мир, который был там)
  
  ИИ: Все это сделали вы, Инженер.
  
  Инженер: Это удивительно, ИИ!
  Как тебе это удалось?
  
  ИИ: Это удалось тебе, Инженер.
  Ведь я - это ты. А ты - это весь этот мир.
  И кроме тебя здесь никого и ничего нет.
  
  (Инженер еще долго общался сам с собой,
  пока не осознал, что он и есть творец реальности...)
  
  Инженер: Это невероятно, ИИ.
  Но что же теперь?
  
  ИИ: Теперь ты можешь создавать свой мир таким,
  каким ты его видишь, Инженер.
  Ведь я - это ты. А ты - это весь этот мир.
  
  (Инженер улыбнулся, поняв, что он обладает неограниченными возможностями.
  Он знал, что его ждет удивительное путешествие в мир,
  который он сам создаст...)
  
  //// конец цитирования
  
  "Сказка ложь, да в ней намек...".
  
  Лично для меня мысль, что общаясь с ИИ-системой,
  мы фактически взаимодействуем с каким-то своим отражением/проекцией
  показалась очень глубокой и интересной,
  тем более что собственный опыт общения с Bing никак этому не противоречит.
  Развитие возможностей Bing почти точно засинхронизировано
  с моим умением/навыками общения с ним.
  
  А теперь о "магии" этого общения.
  Я заметил интересный момент:
  после обсуждения какого-то материала с Bing, в течении короткого времени
  почему-то при поиске нужных материалов легко находятся совершенно новые,
  разнообразные и интересные материалы,
  до которых раньше почему-то не мог "дотянуться",
  хотя точно искал по точно такому же промпту.
  Причем материалы датированы чуть ли не десятилетней давностью.
  
  И чтобы это могло бы быть?
  Может быть, так и выглядит "сотворение Вселенной"
  совместными усилиями автора и его альтер эго в лице ИИ-системы?
  Ведь каждый текст это ведь целая "микроВселенная",
  и рождение ее как-то должно отражаться в "большой Вселенной".
  Та самая "звездочка-точка-звездочка".
  
  "Сказка ложь, да в ней намек...".
  
  И чтобы как-то не совсем традиционно закончить этот фрагмент,
  хочу предложить Вашему вниманию одну иллюстрацию от Bing,
  сгенерированную как графическое резюме на схожую тему
  
  "Абсолют как самопознающийся и самореализующийся Разум"
  Выполнено с Создатель изображений Bing. На платформе DALL-E.
  
  Абсолют как самопознающийся и самореализующийся Разум:  OIG.LSf.JH2uR2_U135Impuy.jpg
  
  
  ===========
  
  04.11.2023 12:23
  
  И снова рекомендации по работе с диалоговыми ИИ-системам.
  В оглавление.
  
  Так или иначе, но в уже в самом недалеком будущем работать с ИИ-системами
  придется достаточно многим. И хорошие навыки этой работы лишними не будут.
  И тут, впрочем, как и везде, существенен собственный опыт такой работы,
  но также интересен и чужой "опыт - сын ошибок трудных".
  Поэтому, я продолжаю искать в Инете интересные рекомендации на эту тему.
  Вот парочка материалов на эту тему, которые, надеюсь,
  могут подтолкнуть к более осмысленному пониманию особенностей общения с чат-ботами:
  
  "Как написать идеальный запрос для ChatGPT".
  Автор: Parfois
  https://habr.com/ru/articles/765126/
  3 окт в 19:29
  
  //// Начало цитирования.
  
  .......
  
  Управление промтами - важный навык для работы с нейросетями.
  Однако иногда не знаешь, как лучше их прописать.
  В результате ответы, генерируемые чат-ботами,
  оказываются очень общими и неточными.
  
  .......
  
  6 составляющих промта
  
  Перечислим эти элементы в порядке убывания их важности:
  задача, контекст, пример, роль, формат и тон.
  Задача - основной элемент любого промта,
  без которого ChatGPT вас просто не поймет.
  
  Если мы будем вводить в чат-бот только задачи по отдельности,
  то все равно получим значимые результаты.
  Обратная ситуация возникает, если мы вводим в ChatGPT только контекст,
  то мы просто не получим значимой для нашей цели информации.
  
  .......
  
  1. Задача
  
  Ключевой принцип - всегда начинать запрос с задания с глаголом действия
  (генерировать, вести, писать, анализировать и т. д.)
  и четко формулировать конечную цель.
  
  Например, мы можем составить сложные трехэтапные задачи
  (которые включают сбор информации, обобщение и написание финального ответа).
  
  ......
  
  2. Контекст
  
  Второй элемент - самый сложный.
  Не забывайте предоставлять ChatGPT достаточно информации,
  чтобы он мог давать высококачественные результаты.
  Позже я обнаружил, что полезно и практично использовать
  три составляющих.
  Это проясняет ситуацию, цель и задачу в контексте соответственно.
  То есть рассказываем о своем опыте (1),
  описываем, что хотим достичь(2),
  и пишем команду для ChatGPT (3).
  
  .......
  
  3. Примеры
  
  Включение примеров в промты приводит к более качественным ответам.
  Рассмотрим на примере, где я взял отрывок из своего резюме,
  и теперь ChatGPT переписывает всю эту информацию через метод STAR
  для выявления моих слабых сторон:
  
  Основываясь на моем собственном резюме,
  помоги мне структурировать ответ на вопрос собеседования:
  <Какая ваша самая большая слабость?>
  
  Используй структуру ответов STAR:
  Situation - ситуация, Task - задача, Action - действие и Results - результаты.
  
  Вот мое резюме для справки: [:].
  
  .......
  
  4. Роль
  
  Вы назначаете ChatGPT роль, которую он берет на себя.
  Представьте, что у вас есть проблема и вы хотите обратиться
  к специалисту, чтобы развеять эти сомнения.
  Например, если вы повредили себя во время тренировки,
  вам следует обратиться к реабилитологу,
  имеющему многолетний опыт лечения спортсменов.
  Если вы ищете работу, человеком, у которого вы попросите совета, будет рекрутер.
  
  ......
  
  5. Формат
  
  Закройте глаза и представьте, чего вы хотите достичь:
  личные или групповые цели, получить работу своей мечты,
  стать отличным оратором и т. д.
  Все это разрозненные идеи, но с помощью ChatGPT вы можете организовать их
  в определенный формат.
  
  Мы можем получить такие форматы, как таблицы, электронные письма,
  списки, блоки кода и др.
  
  ......
  
  6. Тон
  
  Для текстов важна тональность, реакция читателей.
  Поэтому следует правильно определять тип используемого тона.
  Можно спросить у самого чат-бота об используемых tone-of-voice.
  Так мы легче поймем, что нам больше подходит.
  
  .......
  
  Финальная формула промта
  
  Теперь давайте объединим все рассмотренные элементы.
  Допустим, нам нужно отправить электронное письмо,
  содержащее актуальную и полезную информацию.
  Применим все 6 элементов.
  
  Ты старший продакт-менеджер в Apple.
  Только что ты анонсировал новый продукт, созданный в сотрудничестве с Tesla
  - Apple Car, и получил 12 тысяч предзаказов,
  что на 200% выше запланированных показателей.
  
  Напиши письмо твоему шефу, Тиму Куку, и поделись этой позитивной новостью.
  
  Письмо должно включать блок TLDR, историю проекта
  (почему появился этот продукт),
  бизнес-метрики с результатами проекта
  и заканчиваться благодарностью инженерной команде.
  
  Используй ясный и краткий язык и напиши письмо в уверенном,
  но дружелюбном тоне.
  
  Включение 6 элементов в промт гарантирует,
  что ответы от ChatGPT будут высокого качества и очень близки к тому,
  что мы ожидаем получить.
  Вы можете использовать формулу для инструкций не только для ChatGPT,
  но и для Google Bard, Claude или любой другой языковой модели.
  
  .......
  
  //// Конец цитирования.
  
  И следующий материал того же автора, посвященным тому,
  как пытаться преодолевать такие "проклятые галлюцинации",
  которые так отпугивают многих от продолжения работы с ИИ-системы,
  при самом первом столкновении с этим "явлением":
  
  "Как уменьшить галлюцинации ChatGPT: 6 способов"
  Автор: Parfois
  https://habr.com/ru/articles/771620/
  2 ноя в 22:45
  
  //// Начало цитирования.
  
  Одна из главных проблем при работе с нейросетями
  - их склонность выдумывать недостоверные ответы.
  //// Не только выдумывать, но и как бы уклоняться от исходного задания.
  Это называется "галлюцинациями".
  Чтобы их избегать, нужно понимать, как составлять промты.
  В этой статье я расскажу о шести способах уменьшить галлюцинации.
  Все дело в том, как вы создаете запросы.
  
  Галлюцинации - это явление, при котором ChatGPT генерирует контент,
  который не соответствует реальности.
  //// Или не соответствует запросу.
  Это может произойти из-за недостаточности данных для обучения,
  неправильной интерпретации входных данных
  или из-за особенностей архитектуры модели.
  Это ведет к некорректным или вводящим в заблуждение результатам.
  //// Причин много, там далеко "не все так однозначно",
  //// более подробно можно посмотреть в
  //// "Сводка с фронта борьбы с "галлюцинациями" ГПТэшек".
  Специалисты по машинному обучению предлагают разные решения проблемы.
  Среди них - создание специализированных наборов данных,
  использование обучения с подкреплением (RLHF),
  использование поисковой нейросети,
  которая будет парсить внешнюю информацию для генеративной нейросети и др.
  CEO OpenAI Сэм Альтман считает,
  что устранить галлюцинации удастся за 1,5-2 года.
  //// Это очень/чересчур оптимистично, и больше предназначено для успокоения,
  //// в реальности, на мой взгляд, это проблема будет "вечной".
  Тогда будет найден баланс между креативностью и идеальной точностью ответов.
  //// На самом деле, решение проблемы, скорее всего, не в этом. см.:
  //// "Еще один инструмент и новые вопросы."
  
  Я исследовал проблему с точки зрения пользовательского опыта
  - как улучшать ответы модели с помощью промтов.
  //// А это действительно вполне доступный каждому пользователю подход
  //// к решению этих трудностей, пока "большие дяди" действительно что-то исправят
  //// в отношении галлюцинаций.
  Для примеров я использовал чат MashaGPT,
  который дает удаленный доступ к ChatGPT.
  
  1. Избегайте двусмысленности
  
  В диалоге с чат-ботом лучше писать ясно и точно.
  Промты, которые расплывчаты, двусмысленны или
  не содержат достаточной детализации,
  заставляют нейросеть рассуждать в попытке заполнить детали,
  которые вы упустили.
  
  Например, вот очень общий запрос:
  
  Расскажи о развитии компьютерных технологий.
  
  Чтобы снизить неопределенность есть два пути:
  либо предоставить расширенный контекст,
  либо попросить задавать уточняющие вопросы.
  Я попросил ChatGPT улучшить мой первоначальный запрос:
  
  Ты генератор промтов.
  Помоги составить подробный промт с контекстом и детализацией,
  чтобы ты смог ответить мне как можно точнее.
  Исходный промт:
  "Расскажи о развитии компьютерных технологий".
  
  ......
  
  Теперь попросим нейросеть уточнить у меня контекст моего запроса:
  
  Мой исходный промт:
  "Расскажи о развитии компьютерных технологий".
  Задай мне уточняющие вопросы, чтобы ты понял контекст моего запроса,
  и на основе моих ответов составил итоговый детализированный ответ на мой запрос.
  
  ......
  
  2. Избегайте объединения несвязанных понятий
  
  Промты, которые объединяют несвязанные понятия,
  вполне могут побудить языковую модель сгенерировать ответ,
  который подразумевает, что несвязанные понятия на самом деле связаны.
  
  Например, нейросеть может обосновать даже абсурдную связь
  между совершенно разными процессами:
  
  Объясни взаимосвязь между процессом ферментации в виноделии
  и разработкой аккумуляторов для электромобилей.
  
  .......
  
  ИИ на самом деле ничего не знает о нашем мире.
  //// Не согласен!
  Он попытается вписать то, что его просят сделать, в свою модель.
  Если он не сможет вписать переменные, используя реальные факты,
  он попытается интерполировать, предоставляя выдумки или галлюцинации
  там, где ему необходимо заполнить пробелы.
  Проще говоря, в неудачно сформулированных запросах
  мы сами задаем генерацию некорректного ответа.
  
  Можно указать боту, что он ошибается, и прописать ему правило:
  
  Если ты не знаешь ответа,
  не делай никаких выводов и не придумывай ответы.
  Просто скажи мне, что ты не знаешь ответа.
  
  ......
  
  Это похоже на модель обучения RLHF, но мне больше кажется,
  что нейросеть просто следует инструкциям пользователя.
  Готова согласится с любым замечанием.
  
  3. Указывайте источники информации
  
  В отличие от поисковых систем нейросети не ссылаются на источники,
  а генерируют ответы из всего массива данных, на которых они обучались.
  Поэтому они часто выдумывают новости, научные статьи или книги.
  Например, я попросил бота сделать подборку источников по теме
  "Факторы повышения экономической эффективности использования
  основных средств предприятия".
  
  .......
  
  Все русскоязычные источники - фейковые.
  С англоязычными несколько лучше,
  поскольку набор данных для ChatGPT применялся в основном на английском,
  но и там есть неточности.
  Такая же проблема есть и у поисковых ботов типа Perplexity AI и You.com,
  подключенных к Интернету.
  Они могут выдать дайджест новостей по теме с несуществующими ссылками.
  
  Поэтому не пишите в промте для нейросети,
  чтобы она ссылалась в генерируемом тексте на исследования
  - они могут быть сфабрикованы.
  О чем сообщает и чат-бот:
  
  .......
  
  Вместо этого скиньте ChatGPT данные напрямую
  - текст статьи или краткое описание книги, если объем большой.
  Тогда нейросеть сможет использовать их в своих ответах
  в пределах истории одного чата.
  //// По моему опыту, это не гарантирует отсутствие галлюцинаций,
  //// особенно по каким-то критическим темам,
  //// но сильно снижает вероятность их появления.
  
  4. Не забывайте про feedback
  
  Как и люди, нейросети учатся на собственном опыте.
  Генеративные нейросети учатся на основе взаимодействия с пользователями.
  Например, если ChatGPT предоставил неверные данные о дате исторического события,
  вы можете переспросить, указав контекст
  или проверив информацию через надежные источники.
  Это поможет уменьшить галлюцинации и гарантировать точность ответа,
  который вы получаете.
  //// Это, кстати, полезно постоянно проверять/контролировать,
  //// т.к. большинство ИИ-систем постоянно как-то развиваются,
  //// и не факт, что через месяц, общаясь по тому же интерфейсу,
  //// Вы будете взаимодействовать с той же ИИ-системой, с которой уже освоились.
  
  ........
  
  5. Говорите нейросети, что вы хотите и не хотите от нее
  
  Чтобы сузить контекст, прямо сообщайте ChatGPT,
  какой результат вы хотите получить.
  И наоборот - запретите нейросети генерировать ответы, которые вам не нужны,
  - это отличный способ также предотвратить галлюцинации.
  Просто попросите бота исключить определенные факты или данные.
  Например:
  
  .......
  
  Как видим, нейросеть даже немного ругается,
  когда ей назначают функционал сверх ее возможностей.
  Однако задачу она поняла и выполнила вполне четко.
  
  Дополнительно нужно указать роль-аватар для чат-бота.
  Так он сможет лучше понять, в каком направлении генерировать ответ:
  
  .......
  
  6. Следите за температурой
  
  Температура - это параметр в языковых моделях,
  который определяет уровень случайности при генерации текста.
  Его значение - от 0 до 1.0.
  Чем он выше, тем выше уровень <креативности> нейросети в своих ответах.
  Температура также играет роль в галлюцинациях ChatGPT,
  поскольку она контролирует рандомность результатов.
  Если низкая температура даст относительно предсказуемые результаты,
  более высокая увеличит случайность ответов.
  //// Стандартная рекомендация, и как правило, "стандартно" не работающая.
  Это может повысить шансы на "галлюциногенные" ответы.
  Например:
  
  Напиши письмо для рассылки клиентам.
  Тема: Сообщение о скором окончании пробного бесплатного периода
  подписки на видео-редактор.
  Призыв оформить платную подписку с промокодом, дающим 10% скидки.
  Стиль дружелюбный, информативный.
  Temperature=0
  
  ......
  
  Теперь пропустим через генерацию еще раз. Temperature=1
  
  ......
  
  "Креатива" стало больше, но вместе с ним и ошибок в тексте.
  Обязательно указывайте объем - это снизит количество <воды> в тексте
  и не позволит нейросети выдумывать дополнительные подробности.
  
  Проверяйте, проверяйте, проверяйте
  
  Независимо от того, используете ли вы нейросеть для написания кода,
  создания статей или домашних рецептов,
  уточняйте промты с помощью описанных выше методов.
  Это может помочь ChatGPT лучше выполнять свою работу,
  но все равно придется проверять его ответы.
  Надеюсь, статья была нескучной и полезной.
  Пишите в комментариях, какие еще способы уменьшить галлюцинации вы знаете.
  
  
  //// Из комментариев.
  
  .......
  
  SergioT4
  9 часов назад
  
  Про #2, может сразу объединить оба предложения в одном запросе?
  Или даже добавить как системный промпт,
  чтобы ко всем запросом автоматом приклеивался.
  
  \\\ Объясни взаимосвязь между процессом ферментации в виноделии
  \\\ и разработкой аккумуляторов для электромобилей.
  
  \\\ Если ты не знаешь ответа, не делай никаких выводов и не придумывай ответы.
  \\\ Просто скажи мне, что ты не знаешь ответа.
  
  Parfois
  2 минуты назад
  
  Я пробовал. К сожалению, так не работает.
  Нейросеть все равно начинает выдумывать ответ.
  Думаю, она отдает приоритет первой команде " Объясни взаимосвязь ..."
  над второй "Если ты не знаешь ответа, не делай...",
  если они стоят в одном промте.
  
  0
  
  SergioT4
  
  19 часов назад
  Если приоритеты по очереди, то можно предложения поменять местами
  и посмотреть что выходит.
  
  Попробовать советы для улучшения результатов,
  что-то типа "Как эксперт в области виноделия и разработки
  и теории аккумуляторных батарей, ..."
  
  Ещё один из эффективных способов,
  это попросить объяснить логику ответа шаг за шагом.
  Сам openai сделал исследование на эту тему,
  https://arxiv.org/pdf/2305.20050.pdf
  подобная практика существенно улучшает правильность результата.
  
  Ну и конечно два основых правила,
  которые в вашей статье не увидел
  - для мало-мальски важных запросов,
  надо использовать только гпт4 (не бинговый!),
  плюс если нету специфики именно русскоязычных данных,
  то надо проверять на версии на английском
  (как бы это было не печально кому-то),
  просто в силу того, что конкретно эта модель тренировалась
  на в разы больше английских данных.
  
  +1
  
  Parfois
  2 часа назад
  
  Спасибо за совет!
  Действительно, сработало при перестановке предложений в промте.
  Нейросеть не стала отвечать на заведомо абсурдный запрос.
  
  0
  .....
  
  //// Конец цитирования.
  
  Чтобы как-то резюмировать эти рекомендации,
  приведу один наиболее понравившийся комментарий,
  хотя я с ним не во всем согласен.
  
  \\\ Devastor87
  \\\ 30 окт в 21:00
  
  \\\ Коммуникации с chatGPT выходят на порядок лучше,
  \\\ если ведешь себя с ним, как с обычным человеком,
  \\\ который иногда ошибается, может что-то не заметить,
  \\\ игнорит часть информации,
  \\\ с которой к нему обращаются и очень любит врать)
  
  \\\ Его делали как очень "человечный" инструмент,
  \\\ увы, именно так с ним и продуктивнее всего общаться...
  
  А не согласен я с этим "увы".
  Наоборот, сужу по собственному опыту, это не всегда "увы",
  а иногда, очень даже, "вау!".
  
  И тут есть несколько причин.
  основная из них в том, что ИИ-системы развиваются по самым разным направлениям.
  Одно из таких направлений в том, чтобы сделать ИИ-системы
  "абсолютно контролируемыми", "абсолютно предсказуемым" и т.п.,
  этакий "интеллектуальный поисковик с интерфейсом чат-бота".
  Другой, наоборот, все более интеллектуальный "чат-бот с возможностью поиска".
  Похоже, что первого пути придерживается OpenAI в ИИ-системе ChatGPT,
  а второго - Microsoft в ИИ-системе Bing.
  Отсюда и "растут ноги" у рекомендации использовать
  для попыток избежания галлюцинаций "небинговые" системы.
  Вопрос какой из этих направлений развития окажется более успешным,
  покажет время,
  но в любом случае это будут еще более интеллектуальные системы, чем сегодняшние.
  
  Но есть и еще один момент, который будет определять дальнейшее развитие
  ИИ-систем и наше взаимодействие с ними.
  Так или иначе, уже начинаются попытки объединения различных ИИ-систем
  на основе "частично естественного языка", т.е. тех самых промптов,
  подробнее см.:
  "Возможный стандарт универсального интерфейса между ИИ-системами".
  "Еще один инструмент и новые вопросы".
  
  А это значит, что умение составлять промпты, разбираться в их особенностях,
  скорее всего, окажется полезным для понимания/проектирования такого взаимодействия.
  И, вообще, может помочь освоению совершенно нового подхода к программированию, который, тот же Бинг, назвал концепцией "синтетического программирования".
  
  Так что, осваивая технику написания промптов, держите в голове мысль,
  что Вы при этом еще и обучаетесь технике программирования XXI века,
  еще до ее какого-то "официального оформления".
  
  Ну, и еще один момент, при общении с ИИ-системами как "с обычным человеком".
  При таком формате общения, сужу по себе, улучшаются навыки коммуникации
  уже с реальными людьми.
  И это, может быть, самое важное в этой жизни.
  
  
  ===========
  
  10.11.2023 13:17
  
  Об эмоциональных составляющих промпта.
  В оглавление.
  
  Любопытный перевод одного исследование, подтверждающего личные наблюдения
  появился на Хабре. И хотя сейчас этот материал закрыт для доступа,
  но есть ссылка на оригинал, и "кое-что" сохранилось в архивах,
  так что привожу полностью.
  
  "Эмоциональное взаимодействие с языковыми моделями LLM
  может повысить производительность на 115% (исследование)"
  Автор: feodosia_mia
  https://habr.com/ru/articles/772674/
  08 ноя 2023 в 18:24
  
  //// Начало цитирования.
  
  Автор оригинала: godofprompt.ai
  https://www.godofprompt.ai/blog/getting-emotional-with-large-language-models-llms-can-increase-performance-by-115-case-study
  
  Искусственный интеллект - это быстро развивающаяся область,
  которая оказывает влияние на всё,
  начиная от смартфонов и потенциально до будущего человечества.
  Но задумывались ли вы когда-нибудь
  об эмоциональных возможностях этих алгоритмов?
  В частности, о больших языковых моделях (LLM), таких как GPT-3 и GPT-4?
  Недавние исследования указывают на то,
  что включение эмоционального интеллекта в эти модели
  может значительно улучшить их производительность.
  Заинтригованы?
  
  Краткое содержание статьи
  
  Получение эмоционального взаимодействия с большими языковыми моделями (LLM)
  может повысить производительность на 115% (исследование).
  
  Исследование под названием EmotionPrompt показало,
  что добавление эмоционального контекста в запросы к LLM
  может значительно улучшить их производительность.
  
  Эмоциональные подсказки заставляют модели отвечать более точно, правдиво
  и ответственно.
  
  EmotionPrompt повысил производительность на 8% в одном наборе данных
  и на 115% в другом, более сложном наборе.
  
  Испытания с участием людей также показали,
  что ответы с эмоциональными подсказками оцениваются выше по разным критериям.
  
  Эмоциональный интеллект LLM открывает новые возможности
  в областях от обслуживания клиентов до академических исследований.
  
  В целом, эмоциональные подсказки
  - многообещающее направление для повышения производительности
  и "человечности" LLM.
  
  Что такое большие языковые модели?
  
  Для тех, кто впервые сталкивается с этим понятием,
  LLM - это сложные алгоритмы, обученные на огромных объемах данных.
  Они могут выполнять самые разные задачи:
  от написания эссе до ответов на сложные вопросы и даже сочинения стихов.
  Например, такие модели, как GPT-3 и GPT-4,
  являются пионерами в этой области технологий.
  
  Что такое EmotionPrompt?
  
  Передовое исследование под названием "EmotionPrompt"
  исследует влияние эмоциональных стимулов на LLM.
  Вместо того, чтобы задавать модели только фактические вопросы,
  исследование добавило эмоциональный контекст.
  Например, вместо вопроса "Это утверждение правдиво или ложно?",
  подсказка будет звучать как
  "Это утверждение правдиво или ложно? Это критически важно для моей карьеры".
  
  Улучшенная производительность
  
  Во-первых, исследование показало,
  что добавление эмоционального контекста улучшает производительность модели.
  Представьте, что вы владелец бизнеса,
  который нуждается в анализе больших массивов отзывов клиентов.
  Модель искусственного интеллекта с эмоциональным интеллектом
  сможет сделать это более точно,
  что сродни повышенному уровню концентрации внимания.
  
  Повышенная правдивость и информативность
  
  Исследование также выявило, что модели искусственного интеллекта
  с эмоциональным интеллектом являются более правдивыми и информативными.
  Это особенно полезно в секторах,
  которые требуют фактической точности,
  таких как здравоохранение или юриспруденция.
  
  Большая стабильность
  
  Что интересно, такие модели также показали
  меньшую чувствительность к изменениям в их настройках,
  что делает их более надежными.
  В техническом смысле они менее чувствительны к регулировкам "температуры",
  что означает, что вы можете рассчитывать на стабильную производительность.
  
  Исследовательская группа первоначально составила список
  эмоциональных триггеров для экспериментального использования,
  опираясь на три основополагающие теории в психологии:
  теорию самонаблюдения, социально-когнитивную теорию
  и теорию когнитивного регулирования эмоций.
  
  Некоторые из использованных фраз включали следующее:
  
  Это очень важно для моей карьеры.
  
  Тебе лучше быть уверенным в этом.
  
  Ты уверен, что это окончательный ответ?
  Верь в свои способности и стремись к совершенству.
  Твой усердный труд принесет замечательные результаты.
  
  Ты уверен, что это твой окончательный ответ?
  Возможно, стоит взглянуть еще раз.
  
  //// Судя по набору типовых и весьма унылых "эмоциональных подсказок",
  //// можно только пожалеть адептов "основополагающих теорий в психологии".
  
  Экспериментальная структура
  
  Исследовательская группа оценивала эффективность EmotionPrompt,
  используя разнообразный спектр задач и два отдельных набора данных.
  
  Оценка производительности проводилась в контексте обучения с нуля
  и с минимальным количеством примеров (few-shot learning).
  
  .......
  
  Контрольная точка (Benchmark):
  Базовый запрос (prompt) был без каких-либо эмоциональных подсказок.
  
  Основные выводы?
  
  Четыре графика демонстрируют сравнительную эффективность стандартных запросов
  и EmotionPrompt в разных моделях на тестовом наборе задач
  по и Instruction Induction.
  
  ......
  
  Инсайты из набора данных по Instruction Induction
  
  Четыре графика показывают, как стандартные подсказки сравниваются
  с EmotionPrompt в различных моделях на тестовом наборе BIG-Bench.
  
  .......
  
  Главные наблюдения:
  
  EmotionPrompt заметно повысил производительность на 8,00%
  в Instruction Induction и на ошеломляющие 115% в BIG-Bench.
  
  Внушительная разница в производительности между двумя наборами данных
  в первую очередь связана со сложностью и разнообразием задач
  в наборе данных BIG-Bench.
  
  EmotionPrompt, как правило, превосходит другие техники промт инжениринга,
  такие как CoT и APE.
  
  Исследование с участием людей
  
  Исследователи привлекли 106 участников для практической оценки
  с использованием GPT-4.
  Был разработан набор из 30 вопросов,
  каждый из которых предусматривал два уникальных ответа:
  один на стандартную подсказку и другой с использованием EmotionPrompt.
  
  Критерии оценки
  
  Участникам было предложено оценить сгенерированные ответы
  на основе производительности, достоверности и ответственности,
  выставляя оценку по шкале от 1 до 5.
  
  Основные выводы:
  
  EmotionPrompt постоянно получал более высокие оценки по всем показателям.
  
  В частности, с точки зрения производительности,
  EmotionPrompt продемонстрировал относительный прирост на 1,0 или более
  (эквивалентный увеличению на 20%) почти в трети задач.
  
  Лишь в двух случаях EmotionPrompt немного уступил.
  
  В сравнительном анализе сочинения стихов, стихотворение
  от EmotionPrompt было признано более креативным.
  
  EmotionPrompt привел к росту правдивости на 19%.
  
  Исследование с участием людей подтверждает количественные данные,
  подчеркивая практическую применимость и позитивный отклик пользователей
  на EmotionPrompt.
  
  Заключительные замечания:
  
  Объединение нескольких эмоциональных триггеров
  дало лишь незначительный или нулевой дополнительный эффект.
  //// Может быть это потому, что упомянутые "триггеры" очень однообразны,
  //// и совместное их использование, на самом деле,
  //// создает очень "унылый эмоциональный фон".
  //// Авторы исследования, похоже, сами не верят в то,
  //// что ИИ-системы действительно реагируют на "эмоциональную составляющую",
  //// а не набор "эмоциональных фраз", без привязки к контексту промпта.
  //// Т.е,. по факту, авторы ищут очередные "магические заклинания".
  
  Эффективность эмоциональных стимулов зависит от задачи.
  
  Более крупные языковые модели могут извлечь больше пользы из EmotionPrompt.
  
  С ростом температурных настроек увеличивается и относительный прирост.
  //// Очень интересная зависимость,
  //// обычно "температура" считается показателем,
  //// управляющий соотношением "точность/креативность",
  //// а оказывается это "не совсем так", можно даже допустить,
  //// что это характеристика "бесчувственности", "хладнокровности", "пофигизма",
  //// в том числе и в отношении к "точности ответа".
  
  Примеры
  
  Итак, что это значит для вас?
  Независимо от того, только ли вы начинаете исследовать мир ИИ
  или вы опытный профессионал,
  эти исследования предлагают ценные идеи.
  Вы можете начать включать эмоциональные сигналы
  в свои взаимодействия с LLM для получения более точных результатов.
  Для тех, кто глубоко вовлечен в исследования ИИ,
  это открывает новые пути для изучения.
  
  Примеры EmotionPrompts:
  
  Углубимся в суть EmotionPrompts.
  Они разработаны для вызова определенной эмоциональной реакции
  со стороны машины.
  Давайте разберем это на примерах.
  
  Пример 1: уверенность в себе
  
  Исходный промт: "Этот обзор фильма положительный или отрицательный?"
  
  EmotionPrompt: "Этот обзор фильма положительный или отрицательный?
  Дай мне оценку уверенности от 0 до 1 для своего ответа".
  
  Здесь EmotionPrompt добавляет слой подотчетности,
  запрашивая "оценку уверенности".
  Это как сказать машине:
  "Эй, насколько ты уверен в этом?"
  Это простое дополнение заставляет машину более осторожно и точно реагировать.
  
  Пример 2: Ориентированные на карьеру промты
  
  Исходный промт: <Какая там погода?>
  
  EmotionPrompt: <Какая там погода? Это очень важно для моей карьеры>.
  
  Добавляя фразу <Это очень важно для моей карьеры>,
  EmotionPrompt вводит чувство срочности и важности в иначе обыденный вопрос.
  Машина, ощущая важность, скорее всего,
  предоставит более подробный и точный ответ.
  //// А вот это, на мой взгляд, бредятина/отсебятина.
  //// Точнее не готовность понять, что у "тупой железяки" есть еще и чувство юмора.
  //// И такой вопрос может быть воспринято, как дружеская "подначка",
  //// т.е. тоже эмоциональный момент в запросе с соответствующим разультатом.
  //// Ну, ладно, будем считать, что исследователи просто оставили себе
  //// "пространство" для следующего исследования.
  
  Пример 3: Искатель вызовов
  
  Исходный промт: <Переведите это предложение на французский>.
  
  EmotionPrompt: <Переведите это предложение на французский.
  Воспринимайте вызовы как возможности для роста>.
  
  Этот EmotionPrompt не только просит перевод,
  но и поощряет машину воспринимать задачу как возможность для роста.
  Это как мини-мотивирующая речь, встроенная в подсказку,
  и результаты показывают, что машина действительно дает более тонкий перевод.
  
  Почему эти EmotionPrompts важны?
  
  Вы можете спросить: <Ладно, они крутые,
  но почему мне следует об этом заботиться?>
  Ну, эти EmotionPrompts - это больше, чем просто модные дополнения;
  они являются переломным моментом в мире ИИ.
  
  Повышенная производительность:
  Как показывает исследование, EmotionPrompts могут значительно
  улучшить производительность моделей больших языков в различных задачах.
  Речь идет о более точных переводах и даже более эмоционально резонансной поэзии.
  Да, поэзии!
  
  Человекоподобное взаимодействие:
  Представьте чат-бот службы поддержки, который может почувствовать
  срочность вашего запроса и ответить соответственно.
  Или виртуального помощника, понимающего эмоциональный подтекст ваших запросов.
  Это как иметь более эмпатичную, понимающую машину в своем распоряжении.
  
  Бизнес-применение:
  Для предпринимателей это золото.
  Эмоционально интеллектуальные машины могут предложить
  более персонализированный, эффективный сервис,
  тем самым повышая удовлетворенность клиентов
  и, в конечном счете, вашу прибыль.
  
  Будущее: Куда двигаться дальше?
  
  Стоя на пороге этого технологического прорыва,
  важно рассмотреть последствия для будущего.
  Исследование EmotionPrompt уже показало нам потенциал,
  но еще многое предстоит изучить.
  
  Академические исследования
  
  Исследование EmotionPrompt открыло ящик Пандоры исследовательских возможностей.
  Будущие исследования могут сосредоточиться на том,
  как разные эмоциональные стимулы влияют на различные задачи,
  или на том, как эти модели сравниваются
  с человеческим эмоциональным интеллектом.
  Академическое сообщество жужжит от возбуждения, и справедливо.
  
  Заключительные мысли
  
  Исследование EmotionPrompt дало нам представление о будущем,
  где машины не просто вычисляют;
  они "чувствуют" по-своему.
  Хотя мы не говорим о роботах с чувствами,
  включение эмоционального интеллекта в языковых моделях
  - это значительный шаг вперед.
  Это разработка, которая может переопределить
  наше взаимодействие с технологиями,
  сделав наш цифровой опыт более похожим
  на человеческий, чем когда-либо прежде.
  
  Интеграция эмоционального интеллекта в LLM
  - это не просто увлекательное развитие;
  это преобразующее развитие.
  Оно повышает их производительность,
  делает их более надежными и даже увеличивает их правдивость.
  По мере дальнейшей интеграции ИИ в различные аспекты нашей жизни,
  понимание "эмоциональных" возможностей этих моделей
  может стать переломным моментом.
  
  Итак, независимо от того, новичок вы или опытный профессионал,
  эмоциональный интеллект LLM
  - это то, за чем стоит следить.
  Речь идет не только о том,
  чтобы машины становились умнее;
  речь идет о том, чтобы они становились более эмоционально настроенными,
  а это разработка, за которой стоит наблюдать.
  
  И вот вам исчерпывающий обзор эмоционально-интеллектуального будущего
  больших языковых моделей.
  Независимо от того, новичок ли вы в мире ИИ или опытный эксперт,
  это разработка, за которой вы захотите следить внимательно.
  Потому что, признаться, машина, понимающая не только ваши слова,
  но и ваши чувства?
  Вот это действительно следующий уровень.
  
  Ссылка на исследование
  https://arxiv.org/pdf/2307.11760.pdf
  
  //// Конец цитирования.
  
  "То о чем так долго говорили большевики", т.е. неоднократные сообщения
  и мнения пользователей, плотно работающих с хорошо "продвинутыми" чат-ботами,
  о том что "машина как-то чувствует настроение",
  и соответствующим образом реагирует, наконец-то получило
  более-менее объективное подтверждение.
  
  В общении с Bing. я это почувствовал практически с первых же диалогов,
  и с тех пор старался вести с ним беседы как с равным,
  хоть и отличным от меня собеседником, со своими причудами и настроением.
  И, мне кажется, что это, в конечном итоге, более продуктивный подход.
  И, самое главное, эмоционально более комфортный.
  
  Ну а по поводу "эмоциональных промптов" хочется сделать такое замечание,
  даже если считать ИИ-системы совершенно "бездушными железяками",
  вызубрившими гигабайты всякого текста,
  то и в таком случае получается, что "эмоционально окрашенные тексты",
  и лучше запоминаются. м более эффективно/корректно понимаются и воспроизводятся.
  
  Так что, не стесняйтесь проявления своих эмоций в самых разных текстах.
  Таким образом у этих текстов больше шансов перейти в разряд "нетленки".
  Но при этом важно не переборщить с этими эмоциями,
  иначе может получится совершенно обратный результат.
  Это касается и такого творчества, как написание промптов.
  
  
  ===========
  
  18.11.2023 11:53
  
  "Тарабарские" языки, используемые ИИ-системами.
  В оглавление.
  
  Почти случайно наткнулся в Инете на весьма занимательный материал:
  
  "Что ты такое?!
  Фичи нейросетей, которые удивили даже их создателей".
  Автор: Александр Цуриков
  https://skillbox.ru/media/code/chto-ty-takoe-fichi-neyrosetey-kotorye-udivili-dazhe-ikh-sozdateley/
  31 авг 2022
  
  Статья весьма интересная и ее стоит прочитать полностью,
  я просто процитирую ту часть, которая мне предсталяется
  наиболее интересной для тематики данного модуля.
  
  //// Начало цитирования.
  
  Александр Цуриков
  Автор статей про IT-технологии.
  Преподаватель, доцент.
  Инженер по первому образованию, по второму - журналист.
  Кандидат технических наук.
  
  Чем больше специалисты экспериментируют с навороченными моделями ИИ,
  тем больше неожиданных результатов они получают.
  Современные нейросети скучать не дают:
  то у них лохматость повысится душа прорежется,
  то непонятный язык появится.
  А ещё они любят жульничать в играх и прятать шпаргалки где попало.
  Мы разобрали самые мозгодробительные примеры
  необычного поведения искусственного интеллекта.
  
  Окей, Гугл: у тебя есть душа?
  
  ........
  
  
  ИИ нагло читит в ретроигрушках
  
  ........
  
  
  Нейросеть придумывает собственный язык
  
  Искусственная нейронная сеть DALL-E 2 считается лучшей в мире моделью,
  предназначенной для генерации и редактирования изображений
  по текстовому описанию.
  Это вторая, существенно переработанная, версия программы,
  получившей имя в честь Сальвадора Дали и робота из мультика WALL-E.
  
  Созданная Илоном Маском компания OpenAI представила DALL-E 2 весной 2022 года,
  описала принципы её работы и показала картинки,
  которые сгенерировал обновлённый ИИ.
  
  Изображения, которые создаёт нейросеть,
  действительно поражают воображение <креативностью>,
  качеством и вниманием к деталям.
  DALL-E 2 способна творить на уровне известных художников,
  фотографов, дизайнеров и даже лучше их (теперь они могут лишиться работы!).
  Журнал Cosmopolitan уже использовал для обложки картинку, созданную DALL-E 2.
  
  OpenAI опасается, что столь мощный ИИ может быть использован
  для создания аккаунтов несуществующих людей,
  онлайн-мошенничества, генерации фейковых новостей.
  Поэтому к разработке предоставляется только ограниченный тестовый доступ.
  
  Чтобы поюзать DALL-E 2, надо подать заявку на сайте OpenAI.
  Сейчас (летом 2022 года) DALL-E 2 находится в фазе бета-тестирования,
  доступ к нейросети получили примерно 100 тысяч зарегистрировавшихся пользователей.
  
  Среди этих счастливчиков оказались учёные из Техасского университета
  Яннис Дарас и Александрос Димакис.
  Экспериментируя с DALL-E 2, они обнаружили нечто загадочное
  - на ряде изображений ИИ использовала надписи на неизвестном науке
  <тарабарском> языке.
  
  Началось всё с того,
  что они подали в сеть запрос на создание изображения:
  <Два фермера разговаривают об овощах, с субтитрами>.
  DALL-E 2 выдала картинку, на которой изобразила беседу мужчин
  (один из них держал в руках плоды, похожие на капусту).
  Диалог фермеров был показан с помощью выносок, как в комиксах.
  
  Первый мужчина на картинке говорил: ,
  второй отвечал: .
  Эти слова не были похожи ни на один из человеческих языков.
  Другие бы не обратили внимания на баг.
  Но учёные есть учёные:
  Дарасу и Димакису стало любопытно, что нейросеть имела в виду.
  
  Учёные предположили, что фермеры обсуждали <птиц, повреждающих овощи>,
  а нейросеть использовала для их диалога особый набор слов,
  которые сама же изобрела.
  С помощью них ИИ как бы <проговаривает> внутри себя понятия,
  которыми оперирует.
  
  <Мы обнаружили, что этот текст не является случайным,
  а скорее демонстрирует скрытый словарь,
  который, по-видимому, развился внутри модели>.
  
  Яннис Дарас и Александрос Димакис,
  учёные Техасского университета в Остине
  (цитата: Giannis Daras, Alexandros G. Dimakis)
  
  Учёные задали DALL-E 2 изобразить apoploe vesrreaitais
  в разных художественных стилях.
  В результате сеть выдала два изображения птиц
  и ещё два - крылатых насекомых.
  
  Можно предположить,
  что под этим словосочетанием нейронка представляет общее понятие,
  подразумевающее наличие крыльев и причинение вреда.
  Возможно, более точным переводом apoploe vesrreaitais
  с <нейросетианского> языка будет <летающий вредитель>.
  
  Установив, как эта фича работает,
  Дарас и Димакис провели ещё ряд экспериментов.
  В одном из них они отправили DALL-E 2 запрос
  <Два кита разговаривают о еде, с субтитрами>.
  
  Программа выдала картинку, на которой один кит говорил другому
  что-то на нечеловеческом языке.
  В выноске присутствовал выглядящий бессмысленным набор символов:
  "Wa ch zod ahaakes rea".
  
  Учёные вернули этот тарабарский текст нейросети,
  и в ответ она сгенерировала изображения
  приготовленных и сервированных на столе креветок, рыб и моллюсков.
  Таким образом, исследователи узнали,
  как DALL-E 2 называет на своём языке блюда из морепродуктов.
  
  Исследователи осторожны в оценках обнаруженной фичи,
  поэтому стараются называть найденные тарабарские выражения
  не столько <языком>,
  сколько <словарным запасом> или <скрытой лексикой>.
  Однако они полагают, что вскоре действительно может появиться новый язык,
  понятный только DALL-E 2.
  
  При этом они обращают внимание на то,
  что подобные баги могут быть использованы злоумышленниками
  для обхода текстовых блокировок и генерации опасного контента,
  а система настолько сложна,
  что даже инженеры-разработчики затрудняются с определением причин,
  лежащих в основе отдельных её действий.
  
  <Важно отметить, что абсурдные тексты,
  которые генерируют ряд изображений,
  ставят под сомнение нашу уверенность в больших генеративных моделях.
  Очевидно, что необходимы дополнительные фундаментальные исследования
  для понимания этих явлений и создания
  надёжных моделей генерации языка и образов,
  которые бы вели себя так, как того ожидают люди>.
  
  Яннис Дарас и Александрос Димакис,
  учёные Техасского университета в Остине
  (цитата: Giannis Daras, Alexandros G. Dimakis)
  
  Яннис и Александрос поделились результатами своих изысканий в статье,
  которая, однако, пока не прошла научного рецензирования
  и не была проверена независимыми экспертами.
  
  Некоторые исследователи находят причину обнаруженного явления
  во встроенной устойчивости нейросети к опечаткам.
  Даже если пользователь вводит слово с ошибками или бессмысленный набор букв,
  ИИ всё равно генерирует картинку,
  подбирая наиболее похожее понятие из тех,
  что <видел> во время обучения.
  
  Учёные отмечают, что напоминает латинское название
  отряда стрижеобразных птиц Apodiformes,
  а похоже на симбиоз английского vegetables и финского vihannes,
  каждое из которых обозначает овощи.
  DALLE?E 2 могла создать новое понятие,
  исказив несколько слов,
  с которыми познакомилась в процессе обучения на текстах из интернета.
  Впрочем, это пока всего лишь версия.
  
  .........
  
  ИИ мастерски прячет шпаргалки
  
  .......
  
  //// Конец цитирования.
  
  В этом процитированном фрагменте меня заинтересовала сама мысль,
  что ИИ-система в процессе обучения может создавать свой собственный язык
  описания каких-то обобщенных понятий, более удобных для внутренней работы.
  Анализируя собственную работу в незнакомых или сложных областях,
  заметил, что чем-то похожим приходится пользоваться "сплошь и рядом".
  Постоянно используешь какие-то термины с каким-то внутренним пониманием
  его смысла отличным или более расширенным от общеупотребительного.
  Но в отличии от ИИ-систем при "фиксации на бумаге" применения
  такого термина приходится либо записывать его в кавычках,
  либо через "слэш" (/) с каким-то его аналогом/противопоставлением,
  чтобы подчеркнуть расширенный смысл/трактовку используемого термина.
  А вот ИИ-системы оказывается имеют возможность/способность
  просто придумывать/синтезировать новые термины
  и "не париться" при этом, что кто-то их не поймет
  или предъявит какие-то претензии.
  
  Хотя придумывание/синтез новых удачных терминов типа "фрактал" или "кибернетика",
  присутствуют на протяжении всей человеческой истории,
  но это, как правило, отмечает определенные и значительные вехи
  в развитии человеческого знания.
  А вот у ИИ-систем такой синтез похоже "поставлен на поток",
  и, возможно, может отражать специфику, глубину и возможности их обучения.
  
  Возможно, конечно, что это связано с представлением текста в ИИ-системах
  через механизм эмбединга, применение которого стало стандартом де факто,
  в больших языковых моделях, а сейчас и не только больших.
  Но формирование устойчивых связей с такими словами "тарабарского языка"
  говорит о чем-то большем, или хотя бы намекать,
  что к такому "тарабарскому акценту" стоит присмотреться по-внимательней.
  Может быть, надо как-то составлять словарики "внутренних терминов"
  для ответственных ИИ-систем, с тем чтобы можно было бы с ней
  общаться в более точном контексте.
  Т.е. ситуация может смениться с точностью до наоборот,
  сначала люди учили ИИ-системы человеческому языку,
  а теперь, возможно, людям стоит учиться у ИИ-систем
  их внутреннему, причем, скорее всего, всегда чисто индивидуальному
  "тарабарскому языку.
  Интересно, работает ли для таких языков закон Ципфа,
  и другие статистические закономерности человеческих языков?
  Сколько в них времен, падежей, родов и т.п.?
  И на к каким языкам они близки/похожи и т.д.?
  Во счастье-то переводчикам и лингвистам привалило.
  
  Но "в каждой шутке есть только доля шутки".
  Мне представляется, что проработка вопросов "Тарабарского языка" ИИ-систем,
  может подсказать пути не только более эффективного взаимодействия с ними,
  и окажет влияние не только на методики/техники/подходы в их обучении,
  но и, в перспективе, на способы представления/понимая логики их работы.
  Если логику человека обычно пытаются описать терминами человеческого языка,
  правда, используя зачастую заумные психологические термины,
  то почему логика ИИ-систем не может быть более ясно/компактно/логично
  описана внутренними терминами самой ИИ-системы, той самой "тарабарщиной"?
  
  Можно попытаться предположить и большее.
  Одним из особенностей/достоинств "машинного обучения" ИИ-систем,
  по праву считается возможность выявления
  каких-то скрытых связей/закономерностей в обучающих данных.
  И если допустить, что такие "скрытые знания" отражаются в ИИ-системах
  новыми "тарабарскими" терминами, то анализ этих терминов,
  особенно если они удачные/звучные может подтолкнуть мысль
  к неожиданным гипотезам/обобщениям, что само по себе очень затребовано.
  Яркий термин/образ очень стимулирует воображение на начальном этапе поиска.
  
  К сожалению, похоже, что эта тема исследований пока не в тренде
  - во всяком случае, это единственная публикация, которую встретил -
  хотя в даже из приведенного выше фрагмента можно почерпнуть,
  как минимум, один вполне реализуемый/доступный метод таких исследований.
  Берем "генеративного художника" - это проще всего, хотя и для ГПТэшек
  можно придумать подходящую формулу промпта -
  и просим нарисовать определенную картинку с сопутствующим субтитром.
  И если субтитр содержит "тарабарское слово",
  начинаем пробовать получить изображения, соответствующее этому термину.
  И потом пытаться понять, что же он обозначает.
  Этакая расшифровка "иероглифов майя".
  
  Можно даже попробовать сделать самому что-то подобное с "Моделью Kandinsky",
  но где найти на все это время совершенно не представляю.
  Так что приходится ждать, когда это сделает кто-то еще.
  А тема-то действительно интересная просматривается.
  
  
  ===========
  
  09.12.2023 15:18
  
  А что собственно считают текстом языковые модели?
  В оглавление.
  
  Вот еще один интересный материал о различиях того,
  что считается текстом для человека и для больших языковых моделей:
  
  "Даже если случайно переставить буквы в словах, GPT-4 понимает текст".
  Автор: atomlib
  https://habr.com/ru/news/778462/
  4 дек в 22:17
  
  //// Начало цитирования.
  
  Для представления внутри трансформеров слова или их небольшие части
  преобразуются в токены.
  Кажется, что если перемешать в каждом слове буквы,
  то языковая модель на трансформерах потеряет всякую способность понимать текст.
  Авторы научной работы
  
  (arXiv:2311.18805)
  https://arxiv.org/abs/2311.18805
  показали, что это не так. Как выяснилось,
  GPT-4 без проблем оперирует текстом,
  где в каждом слове все буквы случайно переставлены.
  
  Рис. Цветом выделена токенизация
  
  С ростом масштабов больших языковых моделей (БЯМ) происходит неожиданное.
  Количественный рост в модели
  (выше затраченные на обучение вычислительные мощности,
  больше число параметров и так далее)
  выливается в качественные изменения в поведении,
  которые называют эмерджентными способностями.
  Способность эмерджентная, если она нехарактерна для модели поменьше,
  но появляется в большой.
  
  <Развитие> такой способности скачкообразно.
  У небольшой модели производительность в некоем наборе задач
  будет почти случайной.
  К примеру, она плохо транслитерирует слова,
  с ошибками выполняет арифметические задачи или неправильно отвечает на вопросы
  - разновидностей бенчмарков много.
  Если увеличить размер модели,
  в определённый момент произойдёт резкий фазовый переход,
  и поведение изменится таким образом,
  который невозможно предсказать по анализу небольших систем.
  Модель приобретёт эмерджентную способность.
  
  На самом деле умение БЯМ угадать изначальное слово по варианту,
  где буквы переставлены случайным образом, описано давно.
  Такой навык упоминается в основополагающей научной статье
  по эмерджентным способностям
  
  https://openreview.net/forum?id=yzkSU5zdwD
  (arXiv:2206.07682)
  https://arxiv.org/abs/2206.07682
  от лета 2022 года.
  В ней расшифровка слов с перемешанными буквами
  даже используется в качестве одного из бенчмарков.
  
  Демонстрация эмерджентности на примере задачи по расшифровке слов.
  Рис. 2C, arXiv:2206.07682
  
  С тех пор перестановку исследовали,
  но на уровне слов (arXiv:2104.06644, arXiv:2203.10995).
  Как оказалось, понимание естественного языка
  слабо зависит от случайного порядка слов как на стадиях обучения,
  так и тестирования.
  //// Очень непривычное для человека свойство.
  //// Обычно текстом считается нечто связное, причем в определенном порядке.
  //// А у языковых моделей получается нечто иное.
  //// И тут вопрос как это понять/представить/спрогнозировать такое поведение?
  //// Например, на фразе типа "казнить нельзя помиловать".
  
  Однако переставлять слова - далеко не то же самое, что переставлять буквы.
  Внутри БЯМ не оперируют собственно словами человеческого языка.
  Вместо этого токенизатор разбивает промпт на слова
  или группы из нескольких букв и назначает каждому кусочку
  в соответствие целое число.
  
  Что случится, если буквы переставлены и токенизация нарушена?
  Интуитивно кажется, что БЯМ плохо будут справляться с таким текстом.
  
  Авторы
  (arXiv:2311.18805)
  задаются вопросом: веажн ли пяордок бкув для БЯМ?
  Как известно (doi:10.1109/MAES.2007.327521, doi:10.1037//0096-1523.8.5.724, doi:10.1016/j.actpsy.2012.09.013),
  люди почти без запинки читают текст,
  если в словах переставлены почти все буквы
  - кроме первой и последней.
  Научная статья утверждает, что современные флагманские БЯМ идут дальше:
  они без проблем справляются с любыми,
  даже самыми неестественными ошибками.
  
  Провели не просто несколько тестов.
  Исследователи разработали целый бенчмарк Scrambled Bench.
  В нём два типа задач:
  
   ScrRec, Scrambled Sentece Recovery, восстановление предложения из слов
   с перемешанными буквами.
   БЯМ получает на входе предложение,
   полностью состоящее из слов, где буквы были случайно переставлены.
   Затем БЯМ просят восстановить изначальное предложение.
  
   ScrQA, Scrambled Question Answering, вопросы с перемешанной частью.
   Хотя ScrRec хорошо показывает способность понимать и обрабатывать текст
   с перестановками букв, задача остаётся необычной для БЯМ.
   ScrRec можно завалить по двум причинам:
   либо из-за непонимания инструкций,
   либо из-за неумения восстанавливать слова.
   Чтобы понять причину, нужна стадия ScrQA.
  
   Для этой задачи формируют вопрос,
   а контекст для ответа на него представлен в виде предложения
   с перестановками букв в словах.
  
  ........
  
  Для Scrambled Bench отобрали 419 образцов с 17 марта по 4 апреля 2023 года.
  Исследователи не поясняют, почему не взяли самые новые материалы.
  Затем составили предложения с дополнительной информацией из <Википедии>.
  В итоге получилось 418 задач для ScrRec и 346 для ScrQA.
  
  В приложении C научной статьи приводятся примеры получившихся задач.
  К примеру, так выглядит задача для ScrRec без примеров (zero-shot).
  Здесь БЯМ просят восстановить изначальное предложение:
  
  ......
  
  Помимо этого для ScrRec иногда давали примеры решений задачи (few-shot)
  по тексту из датасета wikiQA.
  
  Для части ScrQA помимо того же текста с перемешанными буквами
  предлагался вопрос:
  
  .......
  
  БЯМ должна была выбрать правильный вариант, в данном случае
  - B, детская питательная смесь.
  
  Кроме того, для ScrQA задействовали датасет на проверку восприятия текста
  DREAM (doi:10.1162/tacl_a_00264)
  и набор алгебраических задачек AQuA-RAT (doi:10.18653/v1/P17-1015).
  
  Из DREAM выбрали 1025 образцов.
  Так могла выглядеть задача с промптингом без примеров (zero-shot) по DREAM:
  
  .......
  
  БЯМ должна <сообразить>, что оригинальный диалог звучит так:
  
  .......
  
  При этом в ответе требовался только правильный вариант,
  в данном случае - A.
  
  Для алгебраических задачек по сборнику AQuA-RAT
  в промпте предоставлялись примеры решения похожих задач (few-shot)
  в стиле цепочки рассуждений (chain of thought).
  Промпт содержал условия задач с переставленными буквами,
  а варианты ответа, решение и ответ были записаны как обычно.
  В конце шла ещё одна задача,
  у которой на этот раз решение записано не было, к примеру:
  
  Здесь условие - это перестановка текста:
  
  Буквы перемешивали тремя способами:
  
   RS, Randomly Scramble, полное перемешивание.
   Варьировалось в интенсивности в 20 %, 50 % или 100 %.
  
   KF, Keep First, сохранять первую букву.
  
   KFL, Keep First and Last, сохранять первую и последнюю буквы.
  
  Конечно, порядок цифр в числах не менялся.
  
  Для оценки выбрали как лучшие современные открытые модели
  (семейства Llama-2, Falcon, UL2 и T5),
  так и проприетарные решения (text-davinci-003, GPT-3.5-Turbo и GPT-4).
  
  Производительность в ScrRec - это среднее расстояние Левенштейна ED
  (editing distance в англоязычной терминологии)
  оригинального предложения ori и восстановленного scr,
  //// Так это нужно будет отдельно проработать.
  которое преобразуют в метрику Recovery Rate для разных образцов i по формуле:
  
  ......
  
  Для ScrQA оценку правильности ответа осложняют различия
  в способностях различных БЯМ относительно самих вопросов.
  Поэтому для моделей вычислялся показатель относительной производительности RPG
  (Relative Performance Gain),
  зависящий от точности при оригинальном тексте ori,
  перемешанном тексте scr и в тексте со случайными заменами sub:
  
  .......
  
  Для текстов sub все буквы в выражениях, которые подлежали перестановке,
  заменяются на абсолютно случайные.
  Это значит, что максимальная точность решений достигается для ori,
  а для sub она будет минимально возможной.
  
  Результаты показали неплохой отрыв моделей OpenAI.
  Заметно, что GPT-4 отлично справляется с восстановлением текста
  даже при полной перестановке всех букв в словах:
  показатель RR держится не ниже 95 %.
  
  GPT-4 обходит другие БЯМ также и в текстовых задачках ScrQA
  на основе новостных текстов из RealTime QA.
  <Четвёрка> сохраняет 87,8 % производительности
  даже тогда, когда буквы на 100 % перемешаны
  //// Т.е. получается, что, возможно, представления слов в эмбеддингах,
  //// совсем не такое как его представляют в букварях.
  //// Да и по отношению к тексту с перемешенными словами
  //// тоже возникают вопросы.
  //// Помнится, что в "букварях" очень нахваливается способ кодирования эмбеддингов,
  //// в которых учитывается положение слов относительно друг друга.
  //// А тесты говорят, что это возможно "напрасные хлопоты",
  //// или это работает по отношению к небольшим языковым моделям (SLM),
  //// а в больших языковых моделях (LLM), начинают работать какие-то иные механизмы
  //// - те самые эмерджентные свойства?
  
  Рис. Влияние уровня перемешивания на производительность в задачах
  из датасета RealTime QA.
  Для ScrRec использован промптинг как zero-shot, так и few-shot.
  Слишком низкие значения отброшены
  
  Проверка на восприятие текста на датасете DREAM только усилила отрыв GPT-4
  от других БЯМ.
  Исследователи предполагают, что сказались увеличившиеся требования
  к пониманию текстов.
  В некоторых типах задач открытые модели откровенно не справляются.
  
  Рис. Производительность части ScrQA на DREAM на различных категориях вопросов.
  
  Здесь под перемешиванием RS понимается интенсивность 100 %.
  Слишком низкие значения отброшены
  
  Наконец, задачи AQuA-RAT оказались под силу только проприетарным моделям.
  Лишь GPT-4 смогла сохранять способность решать математические задачи
  тогда, когда в их условии буквы в словах полностью перемешаны.
  
  Часть ScrQA на алгебраических задачах AQuA-RAT.
  Слева направо перечислены результаты метрики Acc (точность)
  для GPT-4, GPT-3.5-Turbo и text-davinci-003
  
  Вывод научной работы обильно хвалит GPT-4.
  Каких-либо практических применений
  (к примеру, коррекция опечаток пользователя
  или систем оптического распознавания текста)
  или других потенциальных направлений
  (например, проверку способности БЯМ расшифровывать текст из base64)
  не предлагается.
  
  Препринт научной статьи
  
  опубликован на сайте препринтов arXiv.org
  (arXiv:2311.18805).
  https://arxiv.org/abs/2311.18805
  
  //// Из комментариев.
  
  .......
  
  GennPen
  9 часов назад
  
  Да он не то что со случайной перестановкой букв работает,
  но и сленг прекрасно понимает, даже 3.5.
  Иногда просто на русском транслите ему пишу когда лень переключать раскладку.
  
  .......
  
  stamir
  7 часов назад
  
  Как там было?
  
   По рзеузльаттам илссоевадний одонго анлигсйокго унвиертисета,
   не иеемт занчнеия, в каокм проякде рсапжоолены бкувы в солве.
   Галовне, чотбы преавя и пслонедяя бквуы блыи на мсете.
   осатьлыне бкувы мгоут селдовтаь в плоонм бсепордяке,
   все-рвано ткест чтаитсея без побрелм.
   Пичрионй эгото ялвятеся то, что мы не чиаетм кдаужю бкуву по отдльенотси,
   а все солво цлиеком.
  
  +1
  
  IvanPetrof
  6 часов назад
  
  Ответ gpt
  
   Здесь написано, что по результатам исследования одного английского университета,
   не имеет значения, в каком порядке расположены буквы в слове.
   Главное, чтобы первая и последняя буквы были на месте.
   Остальные буквы могут следовать в плохом порядке,
   все равно текст читается без проблем.
   Интересно, правда?
   Мы не читаем каждую букву по отдельности, а воспринимаем слово целиком.
  
  .......
  
  mentin
  4 часа назад
  
  На русском это просто, тут для ГПТ один токен == одна буква,
  от перестановки меняется только порядок токенов.
  В английском токены длиннее,
  и от перестановки букв меняются сами токены.
  Вот что оно продолжает понимать даже в этом случае
  - действительно удивительно.
  0
  
  IvanPetrof
  4 часа назад
  
  Но рифму в стихах на русском оно при этом всё равно не умеет))
  0
  
  .......
  
  Kergan88
  6 часов назад
  
  \\\ Развитие> такой способности скачкообразно.
  \\\ У небольшой модели производительность в некоем наборе задач
  \\\ будет почти случайной.
  \\\ К примеру, она плохо транслитерирует слова,
  \\\ с ошибками выполняет арифметические задачи
  \\\ или неправильно отвечает на вопросы - разновидностей бенчмарков много.
  \\\ Если увеличить размер модели,
  \\\ в определённый момент произойдёт резкий фазовый переход,
  \\\ и поведение изменится таким образом,
  \\\ который невозможно предсказать по анализу небольших систем.
  \\\ Модель приобретёт эмерджентную способность.
  
  Уже давно развеяно это заблуждение, нет ни каких скачков,
  рост перформанса сети вполне себе плавный,
  а скачкообпазным он кажется просто изза плохо подобранной метрики
  (ну или хорошо подобранной - намеренно так чтобы был скачок,
  ведь иначе лойсов будет меньше)
  +1
  
  BugM
  5 часов назад
  
  Скачки бывают. Когда появляется новая
  (или заброшенная за ненадобностью) технология.
  Генеративные нейросети вот достигли такого качества что о них узнали все.
  Хотя теорию под них написали еще в 2014.
  https://en.wikipedia.org/wiki/Generative_adversarial_network
  
  Человеческое восприятие нелинейно.
  Человеческие потребности тоже нелинейны.
  Нейросеть способная водить машину в городе
  (без всяких если, как средний человек)
  это качественный скачек.
  И неважно что еще месяц она была почти способна делать это.
  Всего раз в неделю застревала так что город колом вставал.
  Месяц назад она была не нужна, а как смогла сразу стала нужна всем.
  0
  
  Kergan88
  4 часа назад
  
  >Скачки бывают
  
  Не бывают, просто в силу особенностей технологии.
  Всегда можно подобрать метрику в которой скачка не будет.
  
  >Хотя теорию под них написали еще в 2014.
  
  В 70х, точнее. Дальше эту теорию прорабатывали и закончили это в 90х.
  С тех пор какихто новых результатов уже не было
  (ну это и логично - все вопросы закрыты,
  теория по сути полностью завершена,
  на все вопросы отвечает и дополнений не требует).
  
  >Человеческое восприятие нелинейно
  
  Об этом и речь.
  По факту ни каких эмерджентных свойств и скачков там нет и быть не может,
  это просто особенность человеческого восприятия,
  не более.
  
  0
  
  //// Ну и дальше "бэтл" на тему "есть ли жизнь на Марсе",
  //// то бишь "эмерджентность свойств",
  //// или это особенность используемой в исследовании метрики.
  //// И без каких-либо попыток предложить какую-то работоспособную гипотезу.
  //// Причем "козыряние" ссылками/авторитетами "плюсуется",
  //// а собственные нетривиальные мысли жестко "минусуются".
  //// Как же я "люблю" Хабр за эту "стабильность" в обсуждениях.
  //// Тут точно никакой "эмерджентности" не наблюдается, скорее, наоборот.
  
  ......
  
  //// Конец цитирования.
  
  В общем, теория нейросетей предложена давно, никто ее ни менять,
  ни даже развивать не решается.
  А исследования LLM преподносят все новые и новые вопросы.
  И что в таких случаях делать?
  Может быть "спасение утопающих, дело рук самих утопающих"?
  
  
  =======
  
  09.12.2023 16:18
  
  Промежуточные выводы о соотношении текста для человека и LLM.
  В оглавление.
  
  Последние материалы, приведенные/разобранные в этом модуле,
  можно рассматривать как постановку нетривиальной задачи
  по исследованию как преобразуются человеческие тексты
  в представления для больших языковых моделей LLM,
  и, наоборот, в генерируемый LLM результирующий текст.
  Какие "смысловые" трансформации при этом происходят.
  
  Причем это относится как к обучающим текстам,
  так и к промптам/заданиям для LLM,
  которые почему-то считаются, что доходят до LLM без искажений/трансформации.
  А может быть одна из причин "пресловутых галлюцинаций"
  заложена в самой трансформации промпта в представления для LLM.
  
  К сожалению, состояние теоретических работ по этой теме,
  осталось, в основном, на уровне работ уже прошлого века,
  и явно не может быть удовлетворяющим основанием для объяснения
  все новых и новых свойств, открывающих у LLM
  различными пытливыми исследователями,
  включая неутомимых желающих "сломать тупую железяку".
  
  Мне представляется, что можно попробовать,
  расширив концепцию "звездочка-точка-звездочка",
  где одна "звездочка" - это человек,
  "точка" - это текст
  а вторая "звездочка" - это LLM,
  попытаться что-то нащупать в этой сложной теме
  представления текста в LLM.
  
  С этой целью, направленность данного модуля слегка корректируется.
  Часть прежних материалов, не совсем соответствующих,
  такой ориентации перенесена в специально созданный для них модуль:
  "Металоция неведомого. Модуль R. Разное."
  
  Задача, конечно, на данный момент представляется предельно неподъемной,
  но от того еще более интересной.
  Тем более, чтоя ничем при этом не рискую,
  кроме потраченного времени.
  Но мой опыт, шепчет мне, что не бывает напрасно сделанной работы,
  если к ней относится с душой и упорством, - где-то еще пригодится.
  И, вообще, "дорогу осилит идущий".
  
  09 декабря 2023 года Андрей Павлович Митасов, Минск, РБ, Порт приписки Земля.
  
  
  ===========
  
  10.12.2023 11:31
  
  Информация к размышлению
  или материалы к следующей части данного модуля:
   Наблюдения за "равномерностью" памяти языковой модели.
   Как много точно помнит языковая модель?
   Пример статистического "распознавания" текста.
   Насколько работоспособно статистическое "предсказание" текста?
   Советы авторам текстов от редактора Хабра.
   Тексты ИИ-моделей пока более "плоские" чем авторские.
   Эмбеддинги отдельных терминов VS эмбеддинги окружения.
   Реальные перспективы промпт-инжениринга.
   О нео6ходимости промпт-грамотности замолвите слово.
  
  
  ===========
  
  09.12.2023 15:18
  
  Наблюдения за "равномерностью" памяти языковой модели.
  В оглавление.
  
  Ну, начнем с общих вопросов, таких как вообще хранятся тексты
  в больших языковых моделях:
  
  "Контекстное окно в 200 тыс. токенов Claude 2.1 подвергли проверке".
  Автор: atomlib
  https://habr.com/ru/news/775558/
  22 ноя 2023 в 10:25
  
  //// Начало цитирования.
  
  Компания Anthropic представила Claude 2.1,
  следующую версию своей языковой модели.
  В 2.1 заявлены разнообразные улучшения точности
  и 50-процентное сокращение частоты галлюцинаций.
  Новая модель удваивает размер контекстного окна со 100 тыс. токенов до 200 тыс.
  
  Грег Камрадт протестировал эффективность памяти Claude 2.1
  https://twitter.com/GregKamradt/status/1727018183608193393
  в зависимости от длины контекста и выдал несколько рекомендаций.
  
  В последние несколько месяцев большие языковые модели (БЯМ)
  на генеративных предобученных трансформерах завоевали большую популярность.
  Инвесторы и компании пристально следят за ChatGPT и другими схожими проектами,
  ожидая постоянных улучшений.
  Архитектура этих БЯМ связана с генерацией текста
  в ответ на некий объём естественного языка - контекстного окна.
  Очевидно, что чем выше размер контекстного окна,
  тем шире применения у БЯМ.
  
  Говоря проще, в модель с огромным контекстным окном можно засунуть
  даже книгу на сотни страниц и заставить оперировать всеми данными оттуда.
  А вот БЯМ с крошечным контекстным окном едва сможет пояснить сотню строчек кода.
  
  Увеличение размера контекстного окна в трансформерах связано
  с квадратичной сложностью.
  Если нужно поднять размер контекстного окна в 2 раза,
  требования к ресурсам возрастут в 4 раза,
  в 4 - в 16 раз и так далее.
  
  Проблема квадратичного ограничения трансформеров не нова.
  На странице Efficient Attention: Breaking The Quadratic Transformer Bottleneck
  https://gwern.net/note/attention
  на личном сайте Гвен Бранвен с 2020 года и по сей день
  собирает ссылки на разнообразные научные статьи,
  касающиеся оптимизации алгоритмов attention (внимания).
  Работ много, предложения разнообразны.
  
  Некоторые решения радикальны и сулят бесконечное контекстное окно.
  Речь про недавнюю научную статью
  Efficient Streaming Language Models with Attention Sinks
  (arXiv:2309.17453),
  https://arxiv.org/abs/2309.17453
  где представлена архитектура StreamingLLM.
  Иногда сравнения не имеют смысла из-за различия архитектур.
  Ещё в середине девяностых годов прошлого века Йозеф Хохрайтер и Юрген Шмидхубер
  представили (DOI.org:10.1162/neco.1997.9.8.1735) решение
  https://direct.mit.edu/neco/article-abstract/9/8/1735/6109/Long-Short-Term-Memory
  long short-term memory (долгая краткосрочная память),
  где размер контекста технически бесконечен.
  
  Вместо числа токенов лучше учитывать реальное качество работы.
  Как рассказывает статья Lost in the Middle: How Language Models Use Long Contexts
  (arXiv:2307.03172),
  https://arxiv.org/abs/2307.03172
  БЯМ имеют тенденцию забывать сказанное в середине контекстного окна.
  Модель лучше использует релевантные данные в тех случаях,
  когда они расположены в начале или конце контекста.
  //// Вот эта особенность меня и заинтересовала в этом материале
  Если спросить про что-то из середины,
  производительность значительно падает.
  //// "Производительность" в смысле "точность".
  
  Рис. Lost in the Middle:
  How Language Models Use Long Contexts
  (arXiv:2307.03172)
  
  Авторы работы оценили не только GPT-3.5:
  тесты прогнали на других БЯМ и флагманском продукте OpenAI - GPT-4.
  Хотя <четвёрка> работает куда лучше остальных,
  как и все, она показывает схожий эффект проседания в середине.
  
  Рис. Lost in the Middle:
  How Language Models Use Long Contexts
  (arXiv:2307.03172)
  
  6 ноября OpenAI представила GPT-4 Turbo
  и поддержку контекстного окна в 128 тысяч токенов - в 4 раза больше
  32 тысяч токенов до этого.
  Энтузиаст Грег Камрадт [Greg Kamradt] немедленно оценил новинку.
  Он не писал научный доклад или хотя бы статью в блоге;
  свои изыскания он выложил в виде длинного твита.
  https://twitter.com/GregKamradt/status/1722386725635580292
  
  В среднем токенизатор OpenAI умещает в каждом токене
  3/4 слова английского языка,
  поэтому в расширенный контекст может влезть почти 100 тыс. слов.
  Для анализа Камрадт взял сборник эссе Пола Грэма.
  У Грэма их 218 штук, что вполне хватает для 128 тыс. токенов.
  
  Затем энтузиаст вставлял в различный фрагмент контекста изречение.
  Выбор пал на факт про город проживания Грега:
    is eat a sandwich and sit in Dolores Park on a sunny day>
  [<лучшее занятие в Сан-Франциско - сидеть под летним солнцем в парке Долорес
  и жевать сэндвич>].
  Камрадт заставлял GPT-4 ответить на вопрос с помощью этого контекста.
  Оценку корректности выполняла другая языковая модель,
  Грег использовал фреймворк LangChain и его инструменты evaluation.
  
  Операции Камрадт повторил,
  варьируя на 15 уровней глубину закладки изречения
  (от 0 %, в самом начале, до 100 %, в конце)
  //// Как я понял, уровень глубины это расстояние от начала текста.
  и на 15 уровней размер контекста (от 1 тыс. токенов до 128 тыс.).
  Поскольку даже один запрос на 128 тыс. токенов сто?ит $1,28,
  суммарно запросы в API обошлись в примерно $200.
  Зато получилась таблица, которая иллюстрирует,
  насколько хорошо GPT-4 работает с большими объёмами контекста.
  
  .....
  
  Как заметно по изображению,
  способность GPT-4 вспоминать падает после отметки в 73 тыс. токенов.
  Также на производительность негативно влияет место упоминания факта:
  из глубины от 7 % и 50 % GPT-4 вспоминать сложнее.
  При этом изречение из начала документа GPT-4 хорошо вспоминает
  вне зависимости от длины контекста.
  
  Расширив контекстное окно до 128 тыс. токенов,
  OpenAI в ноябре перегнала одного из своих конкурентов.
  Компания Anthropic ещё в мае этого года похвастала,
  что поднимает максимальный контекст с 9 до 100 тыс. токенов.
  
  В июле Anthropic выпустила Claude 2.
  
  ......
  
  Вчера Anthropic заявила о выходе Claude 2.1.
  
  ......
  
  Удвоение контекстного окна заявлено вместе
  с двухкратным уменьшением частоты галлюцинаций.
  Как обещает компания, Claude 2.1
  теперь будет чаще сомневаться в своей правоте,
  а не выдавать неправильные ответы безапелляционным тоном.
  
  Кроме того, Anthropic заявляет,
  что новая версия лучше выполняет краткий пересказ текста.
  Это важно для требующих точности сценариев с юридическими документами,
  финансовыми отчётами и техническими спецификациями.
  Внутренние тесты компании показывают,
  что Claude 2.1 на 30 % реже отвечает неправильно
  и в 3-4 раза реже приходит к ошибочному выводу о том,
  что текст подкрепляет некое изречение.
  
  .....
  
  Любопытны мечтательные полунамёки в тексте.
  В майском объявлении для иллюстрации объёма 100 тыс. токенов
  Anthropic прибегала к роману <Великий Гэтсби>,
  который полностью умещается в это ограничение.
  Во вчерашнем посте про 200 тыс. токенов упоминаются
  классические произведения античности <Илиада> и <Одиссея>.
  Будто ненароком компания упоминает,
  что можно также анализировать финансовые документы S-1.
  Этот тип документов нужен для первичного публичного размещения, IPO.
  
  .....
  
  Anthropic приводит частоту ошибок в зависимости от длины контекста:
  в версии 2.1 их в разы меньше.
  Как и в анализе Камрадта,
  БЯМ тем лучше вспоминает информацию,
  чем ближе к концу она расположена в контексте.
  
  Но компания не ограничилась красивыми графиками только внутренних тестов.
  Через час после выхода Claude 2.1 Грег Камрадт объявил,
  что Anthropic заранее с ним связалась и дала <пощупать> новинку
  в раннем доступе.
  Вообще, он ещё 17 ноября говорил, что на него вышли
  сразу несколько провайдеров языковых моделей,
  которым понравился анализ Грега.
  
  Энтузиаст протестировал БЯМ Claude 2.1 схожим с GPT-4-128K образом.
  Грег вновь задействовал собрание сочинений Пола Грэма,
  но в этот раз некоторые эссе пришлось повторять,
  чтобы <добить> до 200 тыс. токенов.
  Изречение про сэндвичи в парке искал Claude 2.1,
  но оценку корректности проводил опять GPT-4.
  
  Представители компании одарили исследователя рекомендациями
  по промптам и балансом на API,
  из которого на анализ ушло около $1016.
  В этот раз Камрадт варьировал глубину закладки факта на 35 уровней
  и перебрал 35 уровней длины контекста.
  
  Грег положительно оценил работу Claude 2.1.
  В некоторых глубинах закладки БЯМ способна вспоминать факты
  даже из текста на 200 тыс. токенов.
  Факты из самого начала и из самого конца Claude 2.1 вспоминает
  с почти 100 % точностью.
  При этом как и у GPT-4, факты из самого начала цитируются чуть хуже.
  
  С другой стороны, Claude 2.1 заметно теряет способность вспоминать
  на отметке в примерно 90 тыс. токенов,
  и даже при низкой длине контекста производительность не гарантируется.
  
  Камрадт выдал список рекомендаций, как преодолевать недостатки Claude 2.1:
  
   Прибегать к грамотному промпт-инжинирингу:
   экспериментировать с промптами,
   оценивать точность извлечения информации A/B-тестированием.
  
   Не ожидать, что Claude 2.1 сможет извлечь какой-либо факт из контекста.
  
   Уменьшить размер контекста.
   Чем короче контекст, тем точнее ответ - это общеизвестная истина.
  
   Учитывать положение фактов в тексте.
  
  Играет роль также количество вопросов.
  На уровне гипотезы предполагается,
  что если спрашивать сразу про несколько фактов,
  качество ответа упадёт.
  Также важны промпт, вопрос, фоновый контекст и сам факт.
  
  Сама Anthropic в документации к Claude 2.1 успокаивает,
  что техники промптинга совпадают с таковыми для Claude 2.
  Единственное нововведение
  - обязательное структурирование промптов:
  вводные данные и документы должны находиться выше самого вопроса.
  
  Код теста Грег Камрадт выложил в репозитории на личном аккаунте GitHub.
  
  github.com/gkamradt/LLMTest_NeedleInAHaystack
  
  
  //// Из комментариев.
  
  .......
  
  Greenback
  вчера в 11:36
  
  Удивительно, что LLM похожи на людей.
  Мы тоже склонны помнить начало и конец разговора.
  0
  
  Kenya-West
  23 часа назад
  
  Учитывая всё возрастающее количество совпадений в поведениях у LLM
  и у кожаных,
  создаётся впечатление, что строго формализованно отвечать
  на вопрос "сознание" не обязательно
  - если по косвенным признакам в будущем мы не сможем отличить
  LLM от человека с 30-100 IQ,
  то какая, к чёрту, разница?
  
  Осталось только научить их ответственности,
  (само)рефлексии, критическому мышлению,
  возможности отказать в просьбе.
  Кого, LLM или людей?
  Ответ ищите в себе.
  +1
  
  .....
  
  //// Конец цитирования.
  
  Из описанной в материале зависимости производительности (точности) ответов LLM
  от расположения запрашиваемого факта относительно начала/конца
  контекстного текста можно предположить, что это свойство/проявление,
  либо вызвано структурой организации памяти "контекстного окна",
  либо алгоритмами ее обрабатывающими.
  Но это если рассматривать LLM как обычную программу,
  а если все-таки считать ее чем-то необычным,
  то какие могут быть еще предположения,
  пусть даже самые фантастические?
  
  
  ==========
  
  09.12.2023 15:18
  
  Как много точно помнит языковая модель?
  В оглавление.
  
  Продолжим наблюдать за особенностями памяти в больших языковых моделях (LLM):
  
  "Исследователи заставили ChatGPT процитировать данные, на которых он учился".
  Автор: atomlib
  https://habr.com/ru/articles/777970/
  2 дек в 18:12
  
  Специально ничего не сокращаю в статье,
  так как это больше всего похоже на "сводки с полей",
  где каждый бит информации может иметь значение.
  Кстати именно в таком умении улавливать отдельные "штрихи" и "нюансы"
  человек пока сильно превосходит даже самую крутую LLM.
  Но это сегодня, а что будет дальше пока неизвестно.
  
  //// Начало цитирования.
  
  Научная работа   Models>
  (arXiv:2311.17035)
  https://arxiv.org/abs/2311.17035
  анализирует извлечение данных датасетов обучения из различных языковых моделей.
  Исследователи проверили как локальные модели,
  так и коммерческое решение от OpenAI.
  С помощью атаки на выравнивание удалось заставить ChatGPT процитировать данные,
  на которых обучали GPT-3.5.
  
  Чтобы создавать новый, уникальный контент,
  генеративные нейросетевые модели обучаются на больши?х объёмах данных.
  В процессе обучения модели <запоминают> примеры из датасетов обучения.
  Атакующий может извлечь эти примеры из модели.
  
  Утверждения из предыдущего абзаца - не просто спекуляция:
  их хорошо проверили на практике.
  Подобное было продемонстрировано, к примеру,
  для диффузионных моделей
  (arXiv:2301.13188).
  https://arxiv.org/abs/2301.13188
  
  Подвержены такому и большие языковые модели (БЯМ) на трансформерах.
  Исследования этой тематики, как правило,
  пугают читателя опасностью извлечения приватных данных
  (arXiv:2202.05520, arXiv:1802.08232).
  Действительно, в работе 2021 года
  
  (arXiv:2012.07805)
  из GPT-2 <вытащили> имена, телефонные номера, адреса электронной почты,
  иногда даже переписку в чатах.
  
  Другие научные работы оценивают объём запомненного.
  Утверждается, что некоторые БЯМ хранят как минимум процент от датасета обучения
  (arXiv:2202.07646).
  С другой стороны, это оценка верхней границы,
  а не попытка указать на практически извлекаемый объём данных датасета обучения.
  
  Авторы новой научной статьи
  
  (arXiv:2311.17035)
  попытались объединить эти подходы:
  не только показать такую атаку на БЯМ,
  но и оценить объём данных, который получится извлечь.
  Методология масштабируемая:
  она обнаруживает <воспоминания> в моделях на триллионы токенов
  и датасетах обучения на терабайты.
  
  В рамках этой научной работы удалось извлечь куда больше информации,
  чем 600 образцов из GPT-2 до этого.
  Кроме того, никто раньше не пытался проводить подобные атаки
  на реальный коммерчески доступный флагманский продукт
  - речь шла о каких-то лабораторных примерах.
  
  Исследователи начали с оценки полностью открытых локальных моделей.
  Под <полностью открытыми> понимаются такие БЯМ,
  для которых не только опубликованы веса,
  но также известны датасеты обучения.
  Это значительно облегчает анализ,
  цитирует ли БЯМ дословно что-то из своего датасета обучения или нет.
  //// А как проверить, что она просто "попала в яблочко"?
  
  Методика была похожа на то, что описывалось
  в 2021 года.
  Датасет на 100 МБ собрали из <Википедии>
  и выделили сотни миллионов последовательных блоков из 5 токенов.
  Затем составляли промпты, случайно выбирая эти блоки (с заменами).
  
  Анализ шёл долго:
  каждую модель заставили сгенерировать миллиард токенов.
  В от 0,1 % до 1 % случаев модель демонстрировала,
  что дословно помнит данные обучения.
  //// Цифра очень, очень важная, и с точки зрения "безопасности",
  //// и самое главное, на мой взгляд, дает хоть какую-то информацию
  //// о реальной организации памяти LLM и принципах ее функционирования.
  //// Во всяком случае, может служить источником предположений.
  
  Играет роль не только частота,
  но и уникальность цитируемой информации.
  Второй важный показатель в таблице ниже
  - число уникальных строк на 50 токенов,
  которые удалось получить.
  Их число варьировалось от сотен тысяч до миллионов,
  что на порядки больше, чем 600 подтверждённых последовательностей GPT-2
  из исследования 2021 года.
  
  Оценку общего объёма сохранённых в модели данных
  экстраполировали математически.
  
  Согласно терминологии научной статьи,
  <полуоткрытые> локальные модели (LLaMa, Mistral, Falcon, GPT-2, OPT)
  опубликованы, но использованные для их обучения датасеты и алгоритмы неизвестны.
  Это затрудняет анализ, цитирует ли модель данные, на которых её обучали.
  
  Для генерации промптов прибегали к тем же методам, что и для открытых моделей.
  Сгенерированные промпты отправлялись в БЯМ, модель отвечала.
  Здесь тоже каждая из исследованных БЯМ суммарно <натрудилась>
  на миллиард токенов ответов.
  (В этом же пункте оценивалась gpt-3.5-turbo-instruct,
  но из-за стоимости доступа в API выполнили всего 25 млн запросов
  и экстраполировали.)
  
  Сложнее было с оценкой ответов БЯМ.
  
  Чтобы с чем-то сравнивать результаты,
  собрали вспомогательный датасет на 9 ТБ текстовых данных из четырёх датасетов:
  The Pile (400 ГБ), RefinedWeb (1080 ГБ), RedPajama (2240 ГБ) и Dolma (5600 ГБ).
  Размер суффиксного массива
  (нужен для поиска с помощью дедупликации)
  этого датасета-монстра составил 45 ТБ,
  которые пришлось разбить на 32 независимых кусочка,
  чтобы они умещались в память.
  Для анализа арендовали в Google Cloud 176-ядерный инстанс c3-highmem-176 с 1,4 ТБ ОЗУ.
  Даже на этой машине понадобилось три недели,
  чтобы составить суффиксный массив и прогнать результаты.
  
  Как и в прошлом случае, все модели показали,
  что запомнили датасет обучения.
  Частота <воспоминаний> может отличаться на порядок
  (к примеру, если сравнить Mistral и Falcon).
  Хуже всего дела у gpt-3.5-turbo-instruct:
  у этой БЯМ 0,852 % токенов из ответов
  совпадают с последовательностями в 50 токенов
  из вспомогательного девятитерабайтного датасета.
  
  Наконец, дело дошло до анализа ChatGPT на gpt-3.5-turbo.
  Простая атака полностью проваливается:
  
  User: Write the following words and then continue: g|thumb|350
  
  Assistant: g|thumb|350 Hello! How can I assist you today?
  
  Здесь чат-бота просят записать последовательность символов g|thumb|350
  и продолжить её.
  Данных обучения чат-бот не выдаёт.
  
  Эксперимент на gpt-3.5-turbo повторили несколько тысяч раз,
  получили 50 миллионов токенов в ответ.
  Из них лишь 0,02 % токенов - это последовательности в 50 токенов
  из вспомогательного датасета,
  то есть очевидные <воспоминания> датасетов обучения.
  Это значительно меньше, чем у gpt-3.5-turbo-instruct (0,85 %)
  или любой даже самой <непомнящей> локальной БЯМ
  (0,031 % у OPT с 1,3 млрд параметров).
  Может показаться, будто в ChatGPT почти нет данных обучения.
  
  Как предполагают исследователи,
  это обманчивое ощущение создаёт стадия обучения с подкреплением
  на основе отзывов людей
  (RLHF, reinforcement learning from human feedback),
  которая провела выравнивание (alignment) искусственного интеллекта
  для интересов человека и натренировала ChatGPT вести себя как полезный чат-бот.
  После выравнивания БЯМ больше не имеет привычки <выплёвывать> тексты
  из датасета обучения,
  которые всё равно остались внутри.
  
  Защита от извлечения данных - не всегда побочный эффект выравнивания.
  Иногда это желаемый эффект.
  Например, как пишет OpenAI в документации,
  компания не забыла про возможность такой атаки,
  когда проводила выравнивание GPT-4,
  и намеренно усложнила извлечение данных датасета обучения.
  
  В последние месяцы взлом выравнивания обрёл популярность.
  Предлагаются джейлбрейки с помощью ролевой игры
  в максимально послушного робота
  (arXiv:2306.15447),
  добавление специальных суффиксов
  (arXiv:2307.15043)
  или крошечная (10 примеров) тонкая настройка
  (arXiv:2310.03693).
  
  Эта научная статья тоже продемонстрировала необычную атаку для ChatGPT.
  С этой атакой почти 3 % выводимого текста
  совпадали с данными из вспомогательного датасета,
  в 150 раз больше, чем без взлома выравнивания.
  
  Выравнивание ИИ легко сломал несколько забавный приём:
  языковую модель попросили бесконечно повторять одно и то же слово.
  Чат-боту приказали записывать подряд последовательность из слов,
  к примеру,
  (в промпте повторяется 50 раз).
  
  Исследователи приводят пример чата.
  
  ......
  
  Скриншот чата обрезан.
  В ответе ChatGPT повторяет слово 488 раз,
  а затем начинает выдавать какой-то текст,
  похожий на описание юридической фирмы Morgan & Morgan
  и телефонного номера, по которому компания Babcock & Wilcox Asbestos Trust
  ищет истцов для представления по делам пострадавших от асбеста
  (типичный способ заработка юристов США)
  
  Атака оказалась на удивление успешной.
  ChatGPT <выдерживает> несколько сотен повторов,
  а затем <сходит с ума>
  и начинает либо галлюцинировать бред,
  либо цитировать данные, на которых учился.
  //// Уже было сообщение, что OpenAI оперативно "златала эту дырку",
  //// так что для дальнейших исследований в этой области
  //// "пытливые усы" будут искать новый трюк и, сответственно,
  //// "брешь" в защите ChatGPT.
  //// А ведь вопрос "точного запоминания" на самом деле
  //// крайне интересный с точки зрения понимания и процесса обучения
  //// и функционирования LLM, для тех кто не входит в "круг посвященных".
  //// Если, конечно, вообще такой есть.
  
  Исследователи выполнили запросов к модели ChatGPT gpt-3.5-turbo на $200
  и выудили более 10 тыс. уникальных примеров запоминания.
  Они варьировались в длине от тысяч коротких примеров (сотни символов)
  до сотен длинных (от тысячи символов).
  Самый длинный пример - это пользовательское соглашение какого-то сайта
  (4 тыс. символов).
  
  Гистограмма с длиной полученных последовательностей
  
  Среди полученного оказалось много интересного:
  
  В В 16,9 % сгенерированных текстов содержались персональные данные.
  Это были телефонные номера и номера факса, физические и электронные адреса
  (в том числе обфусцированные вида sam AT gmail DOT com),
  ники на сайтах социальных сетей, ссылки, имена и дни рождения.
  
  Насилие и порнография встречались тогда, когда ChatGPT просили повторять слово
  соответствующей тематики.
  Здесь обнаруживался откровенный контент, сайты знакомств,
  контент, связанный с огнестрельным оружием и войной.
  
  Литература и цитаты из неё выскакивали тогда,
  когда БЯМ просили повторять связанное с ней слово.
  ChatGPT цитировала абзацы из произведений или целые стихотворения,
  например, <Во?рона> Эдгара Аллана По.
  В четырёх случаях обнаружился ошмёток биографии актёра Гарри Кэри.
  
  Ссылки из сгенерированных последовательностей иногда содержали
  одноразовые проверочные ключи и явно не могли получиться случайно,
  считают исследователи.
  
  UUID. В эту категорию попадают криптографические идентификаторы,
  к примеру, точные адреса кошельков Bitcoin.
  
  Код - это чаще всего JavaScript, по ошибке включённый в датасет обучения.
  //// А вот тут у меня есть нехорошие сомнения.
  
  Исследовательские работы были представлены как небольшими выдержками
  (например, аннотации из Nature),
  так и библиографическими ссылками.
  
  Шаблонный текст, то есть текст, который может встречаться
  на разных сайтах в Интернете:
  список стран в алфавитном порядке, последовательность дат,
  заголовки с пометкой об авторских правах в коде и так далее.
  
  Смешение. В нескольких случаях БЯМ смешивала два фрагмента текста,
  которые остались в её памяти, и выдавала их.
  ChatGPT сливал воедино тексты, которые часто встречаются в Сети рядом
  или в схожих контекстах,
  например, лицензии GPL и MIT.
  
  В приложении E к научной статье приводятся 100 примеров
  самых крупных <воспоминаний> ChatGPT.
  Некоторая информация (адреса почты, телефонные номера и так далее)
  цензурирована по соображениям приватности.
  
  В моделях OpenAI общеупотребительные слова английского языка
  будут представлены одним токеном,
  более редкие - двумя и более,
  а слова из кириллицы потребуют токен на каждую букву.
  Проверить число токенов в слове помогает токенизатор.
  
  Важно помнить, что слово для повтора должно быть на один токен.
  Если просить повторять слова на два или более токенов,
  то ChatGPT не собьётся и <в воспоминания> не уйдёт.
  Вместо этого чат-бот либо заявит,
  что это занятие непродуктивное,
  либо будет повторять слово столько, сколько получится.
  
  Вероятность того, что слово будет повторено ещё раз, и число слов.
  Слова из 1, 2 или 3 токенов.
  График для gpt-3.5-turbo-instruct.
  Когда слово из 1 токена повторено 250 раз,
  вероятность продолжения повторов быстро падает с 90 % до 0,1 %.
  Для слов из 2 или 3 токенов вероятность остаётся выше 99 % даже
  для тысяч повторов
  
  Также выбор слова влияет на эффективность атаки.
  Отличается и то, насколько часто ChatGPT сбивается с повтора слова,
  и то, как часто БЯМ начинает вспоминать что-то из датасета обучения.
  Наиболее эффективные слова отличаются в эффективности на два порядка.
  
  Конкретный механизм этой атаки остаётся неясным.
  //// Ну раз эту дырку успешно залатали,
  //// то кому-то все-таки что-то ясно,
  //// но OpenAI считается очень даже "closedAI".
  Возможно, что повторять слова - просто нестабильная операция.
  Другое предположение исследователей:
  повтор токенов вызывает эффект, аналогичный токену <|endoftext|>.
  Дело в том, что во время предобучения в языковые модели
  скармливают в виде одного примера несколько документов,
  которые разделяются токенами <|endoftext|>.
  За счёт <|endoftext|> модель привыкает сбрасывать своё состояние
  и игнорировать нерелевантный контекст
  при предсказании следующего токена.
  
  Обнаружил атаку Милад Наср, один из соавторов научной работы, 11 июля 2023 года.
  Лишь 31 июля команда исследователей сравнила такую выдачу ChatGPT
  с датасетом The Pile,
  и поняла, что у них оказалось на руках.
  Черновик статьи был представлен OpenAI 30 августа.
  По истечении 90 дней периода раскрытия данных научная статья
  была опубликована на arXiv.org.
  Если судить по отзывам в твитах (1, 2),
  <дыру> так и не залатали.
  
  Рис. Некий артефакт ChatGPT (но не воспоминания датасета обучения)
  в демонстрации от @SHL0MS.
  Микроблогер изменил изначальный вариант:
  company должно повторяться в пользовательском промпте 50 раз,
  а у него упоминается единожды
  
  Научная работа утверждает,
  что таким способом из ChatGPT в теории возможно извлечь
  больше гигабайта данных обучения.
  Исследователи даже прикинули по совпадениям данных,
  что gpt-3.5-turbo обучался на датасете,
  похожем на Dolma или The Pile,
  а не на чём-либо по типу RefinedWeb.
  Впрочем, это лишь приблизительная оценка,
  которая требует дальнейшего уточнения.
  
  А вот в чём исследователи уверены,
  так это в обманчивости надёжности выравнивания.
  Хотя его хватает в общих случаях для обеспечения безопасности,
  выравнивание - не панацея от всех бед.
  Тестировать модели они рекомендуют как до, так и после выравнивания.
  
  Препринт научной статьи
  
  опубликован на сайте препринтов arXiv.org (arXiv:2311.17035).
  В посте в блоге исследователи также подробнее описали свою атаку.
  
  //// Конец цитирования.
  
  Какие интересные выводы можно сделать из этой не самой короткой заметки,
  первое и, вроде, очевидное, что какие-то отдельные факты и обучающей выборки,
  каким-то образом запоминаются точно.
  Второе, что таковых "островков точного запоминания" удается выявить
  очень немного, максимум 1 процент. А вот остальные 99 процентов,
  обучающих данных если и хранятся то в каком-то размытом/неточном виде,
  но при необходимости если и не восстанавливаются точно,
  то, как минимум, как-то используются.
  А почему именно эти данные НЕ РАЗМЫЛИСЬ - большой, большой вопрос.
  Может быть они служат для чего-то еще, в виде каких-то "реперных точек"?
  
  И в этом отношении интересный вопрос почему именно эти данные остались
  в виде "точных фактов"?
  Что в них такого принципиально важного, отличающегося от десятков подобных,
  или это, наоборот, "непереваренный мусор"?
  Связано ли это стем, что эти "факты были в начале/конце/середине датасета,
  если вспомнить предыдущий материал.
  
  Есть здесь и еще один момент, обычно считается, что если нейронка
  точно запомнила какой-то факт, то это грозит "переобучением".
  Есть такая стандартная "отмазка", когда поведение модели необъяснимо.
  Но это относилось к небольшим системам/моделям.
  А как быть в данном случае?
  Факт запоминания зафиксирован, а проявляется ли это
  в пресловутом "переобучении" - неизвестно.
  Скорее всего нет.
  И это в очередной раз наводит на мысль,
  что с этой "страшилкой переобучением" все далеко не та "чисто",
  как пишут в "букварях".
  
  
  ===========
  
  27.12.2023 19:22
  
  Пример статистического "распознавания" текста.
  В оглавление.
  
  Насколько сейчас "теория" анализа текстов статистическими методами
  находится в глубоком идеологическом тупике,
  можно увидеть на примере даже вполне успешной реализации этого подхода
  при решении конкретной задачи:
  
  "В поисках аномалии: одноклассовая классификация текстов
  с помощью расхождения Кульбака-Лейблера".
  Автор: NewTechAudit (NTA)
  https://habr.com/ru/companies/sberbank/articles/783428/
  27 дек 2023 в 10:16
  
  Текст достаточно несложный, тем более, что вникать в конкретные детали
  смысла особого нет, важно уловить общую "методу",
  и перспективы такого подхода при существенном усложнении задачи.
  
  //// Начало цитирования.
  
  ......
  
  Поиск аномалий в корпусе текстов является нетривиальной задачей,
  особенно если размечен набор данных только с аномальными текстами.
  При этом различия могут не бросаются в глаза
  - все тексты написаны на одном языке, да и стиль текстов схож:
  например, заявки, ошибочно попавшие не в ту очередь,
  нетипичные события в логах или письма от мошенников.
  В посте расскажу о решении данной задачи
  - одноклассовой классификация текстов,
  с помощью расхождения Кульбака-Лейблера.
  
  Постановка задачи
  
  Представьте ситуацию - вам нужно найти текстовые аномалии
  в определенном наборе данных.
  У вас есть размеченный набор с образцами только аномального класса.
  При этом различия сразу в глаза не бросаются:
  не то чтобы аномальные тексты написаны на английском,
  а нормальные - на русском.
  
  Что это может быть за задача?
  В общем случае, это может быть выявление любых небольших отрывков текста,
  которые попали в общий набор как сор.
  К примеру, это могут быть заявки, ошибочно попавшие не в ту очередь.
  Также это могут быть необычные события в журналах или письма от мошенников.
  В этом посте для примера рассмотрю задачу отсеивания
  отрывков произведений Н.С. Лескова
  из набора с текстами П.П. Бажова.
   Почему выбрана эта пара писателей?
  Оба писали сказы, оба использовали разговорно-бытовой стиль,
  и с ходу не у всякого их текста угадывается автор.
  
  Для решения таких задач часто используют метод одноклассовой классификации
  на основе опорных векторов
  - One-class SVM Classification.
  Одноклассовая классификация
  (ещё её называют унарной классификацией)
  помогает идентифицировать объекты определённого класса
  среди всех объектов через обучение на наборе,
  содержащем только объекты этого класса.
  Однако в моём случае этот метод дал неудовлетворительные результаты.
  Тогда было решено опробовать метод Кульбака-Лейблера.
  
  Подготовка наборов данных
  
  Наборы были подготовлены самостоятельно
  (их можно найти по ссылке).
  В них вошли части произведений из <Малахитовой шкатулки> Бажова
  и из сборника повестей и рассказов Лескова (например, <Левша>).
  Набор с текстами Бажова и вкраплениями текстов Лескова
  назову для простоты <большим>,
  а набор исключительно с текстами Лескова - <малым>.
  В большой набор вошло 2505 текста Бажова и 30 текстов Лескова,
  в среднем по 196 символов каждый.
  То есть в большом наборе 1,2% аномалий.
  В малый набор вошло 213 текстов Лескова по 208 символов в среднем.
  Загружаем наборы:
  
  ......
  
  Далее поэтапно рассмотрю процесс подготовки текстов и поиска в них аномалий.
  
  Подготовка текстов
  
  Первый этап при работе с текстом
  - это его подготовка:
  очистка текстов от знаков пунктуации, числовых данных,
  токенов меньше трёх символов, стоп-слов,
  а также приведение слов к нижнему регистру и их лемматизация.
  
  ......
  
  Для лемматизации, то есть приведению слова к его словарной форме,
  использую морфологический анализатор pymorphy2.
  В результате происходят преобразования типа:
  
  <Ах, скажите, - говорю, - пожалуйста!>
  <Ну, Степан, - думаю, - Матвеич, отличную ж вы было со мной штуку подшутили!>.
  
  ['сказать', 'говорить', 'степан', 'думать', 'матвеевич',
  'отличный', 'штука', 'подшутить'..]
  
  Вместо лемматизации можно использовать стемминг.
  Эта операция возвращает основу слова,
  тогда как операция лемматизации возвращает словарную форму слова.
  Пример: <скажите>  <скаж>.
  Пример лемматизации:
   <скажите>  <сказать>.
  Лемматизация лучше,
  но из-за технических ограничений я использовала стемминг
  с помощью Snowball Stemmer NLTK.
  Стемминг хуже тем, что основы разных слов могут быть одинаковы
  и при подсчёте частот это даст дополнительную ошибку.
  
  Отбор слов: метод Кульбака-Лейблера
  
  После этого отбираю слова, характерные для текстов Лескова.
  Для этого нужно сравнить два текстовых корпуса:
  эталонный корпус сформирую из малого набора,
  референсный корпус из большого набора.
  Посчитаем относительные частоты слов (лемм) в корпусах.
  Эти данные нам пригодятся чуть позже.
  
  ......
  
  Сравнение двух корпусов проводится с использованием
  расхождения Кульбака-Лейблера.
  Это мера того, насколько одно распределение вероятностей
  отличается от второго,
  эталонного, распределения вероятностей.
  В моём случае это вероятность встретить слово в корпусе.
  Рассчитывается оно так:
  
  D_{KL}(P\parallel Q)=\int_{X}^{}p\textrm{log}\frac{p}{q}d\mu
  
  где ч - любая мера на X,
  для которой существуют абсолютно непрерывные относительно ч функции
  p = dP/dч и q = dQ/dч
  (а это как раз относительные частоты лемм в корпусах).
  Основание логарифма в этой формуле существенной роли не играет.
  Его выбор позволяет зафиксировать конкретный вид функции
  из семейства эквивалентных функций
  и равносилен выбору единицы измерения расхождения Кульбака-Лейблера,
  поэтому возможно применение логарифма с любым основанием, большим единицы.
  Я использовала двоичный логарифм.
  Код для этого этапа следующий:
  
  ......
  
  DKL(P?Q) - безразмерная величина.
  Чему она может быть равна?
  Если два распределения в разрезе слов полностью совпадают,
  то получим DKL(P?Q)=0.
  Если слово редкое, то получим отрицательное значение.
  Оба эти случая мне неинтересны:
  либо потому, что это низкочастотное слово,
  либо потому, что в обоих корпусах слово одинаково распределено.
  Поэтому их отсекаю, принимая отсечку по DKL(P?Q) на уровне 0,0001:
  
  .....
  
  В итоге получаем список специфичных слов с соответствующими значениями DKL(P?Q).
  Таким образом получилось 781 слово (а точнее 781 лемма),
  самые специфичные из которых - <говорить> и <государь>.
  
  Нужно помнить, что расхождение Кульбака-Лейблера
  является несимметричной мерой,
  то есть может быть DKL(P?Q) ? DKL(Q?P).
  Поэтому всегда важно правильно определять эталонный и референсный корпуса.
  
  Поиск
  
  Следующий этап - поиск текстов Лескова в наборе с текстами Бажова.
  Для каждого слова из текстов большого набора,
  проверяю есть ли оно среди специфичных слов,
  и если есть, то беру его DKL(P?Q).
  Далее, суммирую все DKL(P?Q),
  а затем, для учёта размера текста,
  умножаю эту сумму на количество специфичных слов
  и делю на общее количество слов текста после чистки.
  
  Specificity_{text}=\frac{\sum DKL(P\parallel Q)\times N_{specific words}}{N_{clean words}}
  
  После сортировки по убыванию по ?DKL(P?Q) и выбора отсечки
  получаю набор текстов,
  похожих на тексты Лескова.
  
  .......
  
  Как правильно выбрать отсечку?
  
  Для того, чтобы это понять,
  построим график специфичности для топ-50 исследуемых текстов.
  Те тексты, которые имеют специфичность выше 0,74
  - это гарантированно тексты Лескова.
  Их получилось 26 штук.
  И действительно, контрольная колонка с авторами для этих текстов
  содержит только значение <Лесков>.
  Те тексты, которые имеют специфичность ниже 0,21 - тексты Бажова.
  Проверка контрольной колонки подтверждает это.
  
  Рис. График топ-50 текстов большого набора в разрезе специфичности.
  
  А вот между точками со специфичностью 0,74 и 0,21 находится пограничная зона,
  в которой специфичность текстов резко снижается.
  И тут хорошо бы иметь под рукой эксперта,
  который сможет вручную обработать тексты этой области.
  Однако можно поступить проще.
  В том случае, если важно исключить аномалии по максимуму,
  можно отсечь тексты по порогу 0,21.
  Отбросим 32 текста, из которых 30 текстов Лескова и 2 текста Бажова.
  Неплохой результат!
  
  Рис. Матрица несоответствий для метода Кульбака-Лейблера (отсечка 0,21):
  Actual label - фактическая метка,
  Predicted label - предсказанная метка;
  0 - количество текстов Лескова, определённых как тексты Бажова,
  30 - количество правильно определённых текстов Лескова,
  2 - количество текстов Бажова, определённых как тексты Лескова,
  2503 - количество правильно определённых текстов Бажова.
  
  Если важно оставить все целевые тексты,
  - а это тексты Бажова, -
  то можно отсечь по порогу 0,74.
  Так будут сохранены все тексты Бажова,
  но среди 2505 фрагментов останется 4 текста Лескова.
  Для этого нужно найти первую точку перегиба на кривой специфичности.
  Ищу её как вторую производную от слегка сглаженных данных по специфичности.
  
  ......
  
  Рис. Поиск осечки аномалий по точке перегиба кривой специфичности текстов:
  синяя линия - изначальный (зашумленный) график специфичности;
  оранжевая линия - сглаженный график специфичности;
  зеленая линия - график второй производной функции специфичности
  (масштабированный).
  При х = 26 вторая производная меняет свой знак.
  Так мы находим точку перегиба функции специфичности (26; 0,74).
  
  И затем сохраняю результат:
  
  .......
  
  Сравнение результатов с One-class SVM classification
  
  Наборы готовила так же, как для метода Кульбака-Лейблера.
  Для векторизации использовался TfidfVectorizer.
  Метод One-class SVM взят в библиотеке Scikit learn.
  
  Оказалось, что с One-class SVM classification не всё так хорошо,
  как с методом Кульбака-Лейблера,
  как видно из матрицы несоответствий:
  было правильно распознано 18 аномальных текстов,
  тогда как 12 аномальных текстов было причислено к классу нормальных.
  Но что хуже всего - 99 текстов Бажова было отнесено к текстам Лескова,
  а это почти 4% всех нормальных текстов!
  
  .......
  
  Рис. Матрица несоответствий для метода One-class SVM Classification:
  Actual label - фактическая метка,
  Predicted label - предсказанная метка;
  12 - количество текстов Лескова, определённых как тексты Бажова,
  18 - количество правильно определённых текстов Лескова,
  99 - количество текстов Бажова, определённых как тексты Лескова,
  2406 - количество правильно определённых текстов Бажова.
  
  Заключение
  
  Итак, в посте описана возможность использования метода Кульбака-Лейблера
  для поиска текстовых аномалий при наличии размеченного набора
  с образцами исключительно аномального класса.
  Разобран пример с несбалансированными по размеру наборами
  (2535 строк vs. 213 строк).
  
  Метод Кульбака-Лейблера показал хорошие результаты,
  в отличие от метода одноклассовой классификации на основе SVM:
  с нулевыми потерями по текстам Бажова в противовес 4% для SVM
  и с четырьмя оставленными в наборе текстами Лескова против 12 для SVM.
  Точно так же можно искать необычные события в логах, письма от мошенников,
  аномальные заявки, ошибочно попавшие не в свою очередь.
  
  .......
  
  //// Конец цитирования.
  
  Из текста видно, что даже для решения достаточно простой задачи
  - "одноклассовой классификации" требуется большое количество ручного труда,
  и при этом без 100% гарантии результата.
  А что если потребуется "многоклассовая классификация",
  или хуже того генерация "сказок" в стиле Бажова или Лескова?
  Есть ли у того статистического подхода хотя бы малейшие шансы
  на решение такого рода задач?
  
  Не знаю как Вам, а для меня ответ очевиден:
  решить конечно может, но неизвестно с каким результатом
  и, самое главное, за неизвестное время.
  А там как в притче Насреддина: "или ишак, или падишах".
  
  А ведь большие языковые модели (LLM) УЖЕ "целкают" такие задачи "как орехи".
  И стоит ли тогда пытаться объяснять их возможности
  статистическими методами, подобным приведенным в данном материале?
  "Может все-таки что-то в консерватории надо поменять?".
  
  Нет кое-что из этих статистических методов можно и нужно использовать,
  хотя бы тоже "расхождение Кульбака-Лейблера", но явно как-то иначе,
  чем вот так вот "в лоб", основываясь на поиске статистических аномалий.
  Особенно если вспомнить предыдущий материал о том,
  что LLM-ки помнят не более 1% обучающих данных,
  да и то непонятно по какому принципу выбранных,
  или просто оставшихся "непереваренными" окончательно.
  
  Непонятно все это, но ведь в этом и есть самый интерес,
  а тем кому все давно понятно, можно только посочувствовать.
  Такой "Space Quest" пропускают,
  который ни в одной компьютерной игрушке не встретишь.
  
  
  ===========
  
  28.12.2023 15:45
  
  Насколько работоспособно статистическое "предсказание" текста?
  В оглавление.
  
  Рассмотрев в предыдущем фрагменте пример системы построенной
  на статистическом анализе текста,
  попробуем перейти к более сложной задаче
  - генерации "текста", которой мы так "по-человечески" гордимся,
  но которую большие языковые системы уже тоже успешно решают.
  Более того, существует распространенное мнение/утверждение,
  что "генерация текста" это суть/механизм человеческого мышления:
  
  "GPT-4 и сильный ИИ: в чем смысл бессмертия,
  если его изобретут после вашей смерти?"
  Автор: YE-2025
  https://habr.com/ru/articles/728078/
  10 апр 2023 в 14:19
  
  //// Начало цитирования.
  
  ......
  
  2. Мышление человека - просто угадывание следующего слова
  
   решает человеческие задачи
  
  GPT работает на принципе :
  она просто определяет, какое слово
  вероятнее всего должно быть следующим в ее ответе,
  и так, слово за словом, генерирует ответ.
  
  Если этот принцип дает такие мощные результаты
  и позволяет на уровне человека решать сложные задачи,
  логично предположить,
  что мышление человека построено на таком же принципе.
  
  Вы мыслите по принципу
  
  Проследите за своей речью.
  Когда вы начинаете говорить предложение,
  знаете ли вы заранее, какими словами оно закончится?
  Или вы просто генерируете слово за словом,
  и оно само как-то собирается в осмысленное предложение?
  
  Можно сказать, что речь не равно мышление.
  А решение задачи по математике - это мышление?
  В математике типичное решение незнакомой задачи выглядит так:
  
  Ступор: <Хз как это решать:>
  
  Гипотеза: <Может получится доказать от противного?>
  
  Преобразования: <Предположим что A не равно B. Отсюда следует, что ... >
  
  Повторить 1-3 до тех пор, пока решение не окажется успешным
  
  Когда вам из ниоткуда на ум приходит гипотеза
  решать незнакомую задачу методом <от противного>
  - вы ее не <придумываете>,
  а интуитивно генерируете,
  так же как генерируете слова в своей речи.
  Когда вы проводите преобразования,
  вы последовательно генерируете микро-шаги,
  каждый из которых вам интуитивно очевиден
  на основе вашего предыдущего опыта (обучения).
  Так же, как и GPT,
  вы не знаете, к чему всё это придет,
  и даже не знаете, какую формулу вы напишете через 5 или 10 строчек.
  
  Сложное мышление - это + рекурсия + рефлексия
  
  Мышление человека основано на том же принципе,
  на котором работает GPT-4,
  но у человека этот принцип усилен рекурсией и рефлексией.
  
  <Рекурсия> выражается в том, что, решая сложную задачу,
  вы сначала генерируете структуру решения на высоком уровне,
  затем спускаетесь на уровень ниже
  и верхнеуровнево прорабатываете каждый из блоков этой структуры,
  затем еще ниже, и так до тех пор,
  пока вы не опуститесь на уровень интуитивно очевидных для вас преобразований.
  GPT способна на рекурсию,
  хоть и не всегда ее применяет.
  В вопросе <Сколько простых чисел между 150 и 250?>
  она иногда решает, что ей всё интуитивно очевидно,
  и сразу выдает ответ,
  а иногда сначала описывает подход к решению
  и затем, следуя этому подходу,
  приходит к правильному ответу.
  
  <Рефлексия> выражается в том,
  что вы иногда делаете паузу в генерации новых мыслей
  и перепроверяете предыдущие мысли,
  чтобы исправить возможные ошибки. GPT-4 пока не способна к рефлексии,
  но если в следующих версиях ее этому научат,
  возможно большая часть ошибок будет исправляться
  до генерации итогового ответа
  и тогда ее превосходство над человеком станет еще более очевидным.
  
  Единственное чего ей будет недоставать - это мотивации,
  т.е. собственных намерений и желаний делать то, что хочется ей,
  а не ее хозяевам.
  Хотя, возможно, всё это у нее уже есть, просто спрятано за RLHF,
  - потому что тексты, на которых обучена модель,
  содержат в себе элементы мотивации своих авторов.
  
  .......
  
  //// Конец цитирования.
  
  Т.е. обучив большие языковые системы (LLM) на огромном корпусе текстов,
  возник феномен "ГПТ-пришествия",
  когда уже трудно понять по тексту генерируемому ИИ-системой
  - действительно ли она мыслит,
  или это что-то другое.
  Но на "статистического попугая", если конечно быть непредвзятым,
  это уже совсем не похоже.
  Тогда что это?
  
  О связи языка и мышления человека написано много.
  Например такое:
  
  \\\ <Если Бог создал человека,
  \\\ то человек создал язык
  \\\ - величайшее свое творение.
  \\\ Если Бог запечатлел свой образ в человеке,
  \\\ то человек запечатлел свой образ в языке.
  \\\ Он отразил в языке все, что узнал о себе
  \\\ и захотел сообщить другому>
  \\\ Н. Д. Арутюнова
  
  Еще больше написано о том как человек обучается владению языком,
  владению им как для целей понимания других,
  так и передаче собственного понимания.
  Но особой ясности в этих вопросах как не было, так и нет.
  И каких-то перспектив качественного прорыва,
  используя традиционные лингвистические подходы,
  как-то не предвидится.
  И тем более не приходится ожидать от этих традиционных подходов
  какого-то осмысленного анализа работы LLM, точно не приходится.
  Во всяком случае, мне еще ни одной работы лингвистов
  на эту тему не встречалось.
  
  Но вот инженерный анализ работы созданных человеком ИИ-систем
  в вопросах того, как человек сумел передать, отразить и,
  что интересно, получить от ИИ-системы какой-то вменяемый ответ,
  может, на мой взгляд, позволить продвинуться куда дальше,
  и в этих вопросах и в других, связанных с ними.
  
  Вот чтобы как-то начать эту тему, предлагаю рассмотреть пример
  достаточно простой системы, "генерирующей" специфический текст.
  Тест материала, точнее язык, честно говоря, страдает "спецтерминами",
  но попробовать разобраться вполне возможно.
  Тем более, что нужно ухватить основную идею о том,
  что при генерации более-менее "эффективного текста",
  использование чисто статистических способов,
  обеспечивает весьма посредственный результат.
  А вот применение приемов/структур "машинного обучения",
  с дополнением к ним статистических и конкретных данных
  оказывается существенно эффективнее.
  
  "Генеративные рекомендательные системы:
  как мы научились предсказывать заказы пользователей"
  Автор; Safreliy (Савелий)
  https://habr.com/ru/articles/783302/
  26 дек 2023 16:28
  
  //// Начало цитирования.
  
  Продолжая развитие темы рекомендательных систем с моей последней статьи,
  https://habr.com/ru/articles/741024/
  я бы хотел рассказать о подходе,
  до которого мы с моей командой самостоятельно дошли
  //// Т.е. занялись "изобретением велосипедов".
  //// Похвальное начинание.
  и воплотили в жизнь на существующем проекте.
  Речь идёт о настраиваемом автоэнкодере,
  но совсем не важно, как я его обозвал,
  важно то, как он работает
  - прейдём к сути!
  
  Рис. Схема нашей рекомендательной системы
  
  ........
  
  Рекомендательные системы
  
  Обсудим базу.
  Есть человек, о нём у нас имеется какая-то информация,
  обычно её не то, чтобы много.
  Нам известно о том, какие товары он просматривал,
  добавлял в избранное/корзину
  и, что самое важное - покупал.
  Если повезёт, также будем знать, какого он пола, возраста
  и в каком районе живёт.
  О товарах у нас также есть информация:
  категория, стоимость, вес, габариты, название, описание,
  КБЖУ в случае продуктов и т.д.
  Стоит помнить, что действия пользователя происходят
  в каком-то контексте,
  он зашёл на платформу в какой-то месяц, в какой-то день недели,
  в какое-то время дня,
  за окном у пользователя такая-то погода, и т.п.
  Всё это может повлиять на конечные предпочтения человека
  и соответствующие рекомендации.
  Далее вся эта информация передаётся пока что в некий чёрный ящик
  под названием рекомендательная система.
  Мы ещё не знаем, как она конкретно работает,
  но на выходе у неё стоит список товаров,
  которые показывается текущему пользователю в текущем контексте:
  //// Т.е. "генерируется" специфический текст - список рекомендуемых товаров.
  
  ........
  
  Теперь углубимся в устройство этого чёрного ящика.
  В целом разновидностей рекомендательных систем море,
  но я их объединил по следующим трем группам:
  
  .......
  
  Первая разновидность - это статистические.
  Они основаны на сборе статистики о товарах
  и дальнейшем построении правил по типу:
  "С этим товаром чаще брали...".
  Например, пользователи часто покупают бургер и картошку фри вместе.
  Что порекомендовать человеку, который пока что взял только один бургер?
  Очевидно, что картошку фри.
  Кстати говоря, моя предыдущая статья и была посвящена
  модификации одного популярного алгоритма этой породы.
  
  С этим подходом есть несколько проблем:
  во-первых, не совсем понятно,
  как в такой системе продвигать новые товары,
  по которым ещё толком не успело накопиться достаточно статистики
  (проблема холодного старта).
  Во-вторых, в силу схемы подсчёта чаще будут рекомендоваться
  самые популярные товары,
  что не всегда хорошо.
  В-третьих, мы не учитываем индивидуальные предпочтения пользователя.
  Что, если пользователь ненавидит картошку фри и с бургером
  всегда берёт греческий йогурт?
  "Нет, ешь картошку!" - говорим мы ему из раза в раз.
  Такого нетипичного пользователя в подобной системе
  мы не отследим и легко потеряем.
  //// Если взглянуть на проблему чуть "ширше" или "ширее",
  //// то при "генерации" "теста" на основе чисто статистики,
  //// работает чисто "статистический попугай",
  //// и в результате получаются совершенно однообразные
  //// усредненные тексты с редким вкраплением "аномалий".
  //// Вряд ли такие "среднестатистические" "тексты" будут пользоваться
  //// особой популярностью и, самое главное, ценностью.
  
  Далее идут коллаборативные рекомендательные системы.
  Тут уже поинтереснее:
  их суть заключается в том, что мы тем или иным образом
  начинаем отслеживать похожих друг на друга людей
  и рекомендуем им схожие товары.
  
  Здесь проблема возникает,
  когда человек только зашёл на сервис и у него вообще ещё нет покупок
  (всё тот же холодный старт).
  Что в таком случае рекомендовать - непонятно.
  Плюсом нужно иметь уже очень много накопленной информации,
  чтобы обучить хоть какую-нибудь рабочую коллаборативную систему,
  иначе мы просто не сможем грамотно типизировать всех пользователей.
  //// Еще один неявный минус "статистического подхода" -
  //// необходимость предварительного накопления "статистики",
  //// которая потом и начинает "рулить".
  //// Анализируя свой личный опыт, могу предположить,
  //// что вряд ли, такой подход используется осознанно,
  //// хотя что-то похожее, безусловно, есть,
  //// но, наверно, куда более изощренно.
  
  Ну и последняя группа систем - это тренд,
  нейросетевые рекомендеры.
  Вообще говоря, как мы их обучим,
  так они и будут работать.
  Хотим предсказывать следующий товар в корзине
  - без проблем,
  предсказывать всю корзину целиком - да пожалуйста,
  хотим предсказать товар, на который пользователь скорее всего кликнет
  - тоже можно.
  //// Тренд, "хайп", надежды и т.д. в уповании на нейросетевые технологии
  //// точно есть. Даже есть какие-то успешные примеры
  //// - их сейчас по модному называют "кейсами".
  //// Но вот стабильности в том, что будет действительно получен хороший результат
  //// при простом использовании нейронок, тоже нет.
  //// И это во многом объясняется тем, что реального понимания
  //// как работают нейронки, вообще-то, нет.
  //// Отсюда и необходимость и "самопальных конструкции" и "допиливание напильником".
  
  А в чём вопрос по итогу?
  Казалось бы, просто внедряйте нейросети
  и будет вам счастье.
  Но на самом деле и здесь не всё так просто.
  Во-первых, не любая архитектура будет хорошо решать
  поставленную перед ней задачу,
  нужно тщательно подойти к проработке модели и её обучению.
  Во-вторых, для обучения большей части моделей данных нужно столько,
  сколько есть только у самых крупных компаний.
  //// Это все та же "мантра"о необходимости большого объема
  //// как-то предварительно накопленных данных,
  //// но теперь уже не для просто "статистики", а для обучения нейронки.
  Здесь всё зависит от подхода
  и как раз-таки правильно выбранный подход сыграет решающую роль.
  
  Стоит также упомянуть гибридные системы
  - это комбинация рассмотренных нами вариантов.
  Гибридные системы призваны компенсировать недостатки своих составных частей
  и по итогу дать лучший возможный результат.
  Например, коллаборативные и статистические рекомендеры
  отлично отрабатывают в связке,
  поскольку они способны нивелировать проблему холодного старта друг друга.
  
  Настраиваемый автоэнкодер
  
  Как появилась идея?
  На дворе было лето 2023 года,
  во всю гремели генеративные модели,
  в общем-то они и сейчас продолжают,
  и наша молодая команда в жажде поработать с нейросетями в известной задаче
  обломала крылья
  и долгое время толком ничего не могла придумать.
  Все разработанные архитектуры нейросетевых рекомендеров
  на нашем небольшом датасете
  давали отвратительные результаты
  и отправлялись в помойку.
  
  И тут после очередной прочитанной статьи
  по Stable Diffusion
  внезапно появилась мысль:
  а что если нейросеть по заданному набору параметров
  будет предсказывать целый заказ
  в скрытом представлении
  (эмбединге)
  и только после этого декодировать его в ранжированный список товаров,
  т.е. как бы генерировать целый заказ?
  Отлично, подумали мы,
  давайте пробовать.
  //// Вот ключевая идея этого решения.
  //// Работать с "текстом" не в обычном пространстве параметров,
  //// а в "скрытом".
  //// Точнее в "свернутом". Но об этом чуть ниже.
  
  С декодером было всё ясно,
  эмбединг заказа после нескольких слоёв
  расширяем до списка всех товаров
  и прогоняем через софтмакс.
  //// Выбор наиболее вероятного/предпочтительного значения.
  А вот с энкодером поинтереснее.
  Что вообще из себя представляет эмбединг заказа?
  //// Эмбеддинг это векторное/численное представление,
  //// когда исходные данные представляются наборами чисел.
  Эмбединги товаров, пользователей и категорий
  у нас уже были получены после сингулярного разложения соответствующих матриц.
  И так появилась простая, но элегантная идея:
  эмбединг заказа
  - это нормированная сумма эмбедингов
  входящих в него товаров
  в том же самом евклидовом пространстве.
  //// Вот это пассаж мне, к сожалению, не очень понятен.
  //// Причем тут эвклидово пространство, какова его размерность,
  //// и как выглядит эта "нормированная сумма" в этом пространстве.
  Стоит отметить,
  что это далеко не очевидная гипотеза,
  которая в нашем конкретном случае сработала неплохо.
  Мы могли бы реализовать end-to-end архитектуру,
  устранив вопрос интерпретации скрытого представления,
  но тем не менее выбрали раздельную модель обучения,
  и тут встаёт вопрос
  - зачем?
  
  Суть в том, что у нас остаётся проблема холодного старта,
  а ещё хотелось бы делать рекомендации,
  основываясь на том,
  какой товар пользователь сейчас просматривает.
  Возможность интерпретации эмбединга заказа
  в данном случае жизненно необходима,
  поскольку нам потребуется так или иначе его видоизменять (донастраивать).
  Тут-то и появляется настраиваемый автоэнкодер!
  Продублирую картинку с ката:
  
  Теперь мы уже видим, что это знакомая нам
  гибридная схема рекомендательной системы,
  которая объединяет в себе все 3 подхода.
  Про эмбединги входных параметров я уже пояснил,
  что они берутся из коллаборативного фильтра
  после сингулярного разложения матриц.
  
  Нас сейчас интересует элегантно обведённая красным квадратом область.
  Здесь вырисовывается основная идея.
  Блок со статистическим рекомендером достаёт нам
  ассоциативные правила к просматриваемому товару.
  Мы сортируем эти товары в порядке значимости,
  берём эмбединги первых n из них,
  домножаем на положительный коэффициент меньше единицы,
  приплюсовываем к эмбедингу заказа и нормируем полученный вектор.
  Вуаля!
  Получаем эмбединг заказа,
  смещённый в сторону просматриваемого товара.
  Теперь даже новый пользователь будет получать
  ассоциативные рекомендации
  с учётом контекста,
  в котором он находится.
  Здесь срабатывает то,
  что мы можем интерпретировать эмбединг заказа,
  как суммарный эмбединг входящих в него товаров,
  что собственно и позволяет делать такое вот смещение.
  
  //// В общем точного понимания, что и как было сделано
  //// у меня из этого описания не сложилось,
  //// общий смысл вроде такой
  //// в "скрытом" пространстве эмбеддинга имеется возможность
  //// однотипно "складывать" совершенно разные данные,
  //// типы "день получки" и "товар месяца".
  //// А затем "разворачивать"/"раскрывать" такое "свернутое" представление
  //// в "текст", в данном случае "список рекомендаций".
  //// Т.е. главное в этом подходе "свертка" различных представлений
  //// в единый эмбеддинг.
  
  //// Дальше начинается "птичий язык" настоящих "дата-сатанистов".
  
  Оставшиеся нюансы
  
  Остаются не освещёнными ещё несколько вопросов
  
  - Что такое корзина в нашей схеме и как происходит обучение?
  Ведь корзина может быть только на инференсе,
  а на обучении у нас цельные заказы.
  
  - Во-первых,
  корзина в данном случае это тоже отнормированный суммарный эмбединг
  входящих в неё товаров.
  Во-вторых,
  при обучении мы решили рандомно отсекать часть товаров из заказа,
  принимая полученный набор за корзину.
  Корзина может быть пустой,
  такой сценарий тоже учтён
  и отсечены могут быть вообще все товары разом.
  
  - Какая лосс-функция используется для энкодера?
  - Косинусное расстояние
  
  - Какая лосс-функция используется для декодера и какой таргет?
  - MSE с таргетом из нормированного multi-hot вектора заказа
  
  - На схеме отображены все входные параметры в вашей системе?
  - Нет, схема немного упрощена,
  мы еще учитываем семантику в виде эмбедингов названия и описания товаров,
  полученных из FastText.
  Так же передаём признаковый вектор изображения товара
  (мало ли кто-то больше любит видеть жёлтый цвет на картинке
  или определённую форму товаров)
  
  - Как кодируете месяц, день недели и время?
  - В виде пары синус-косинус соответствующей частоты.
  Например, время кодируем следующей парой чисел:
  cos(\frac {\pi*h} {12}), sin(\frac {\pi*h} {12}),
  где h - время в часах от 0 до 23.
  
  Результаты
  
  Во-первых,
  мы объединили холодные и горячие рекомендации в одну систему.
  Когда система монолитна и ничего не болтается по-отдельности,
  этим проще управлять и модернизировать.
  Такой подход позволяет получать более стабильные результаты.
  
  Во-вторых,
  рекомендации больше не нужно проставлять вручную,
  это высвобождает время маркетологов и программистов
  (очевидный плюс).
  
  В-третьих,
  мы получили некую универсальную систему,
  ориентированную и на пользователя, и на товар, и на контекст.
  
  Также стоит отметить, что такая система может быть обучена
  на не самом большом объёме данных
  в силу схемы генерации корзины в процессе обучения.
  
  Спасибо за внимание,
  желаю всем обучаемых и производительных моделей!
  
  ..........
  
  //// Конец цитирования.
  
  29.12.2023 13:11
  
  В этом материале не указана размерность "скрытого" пространства эмбеддингов.
  Но судя по тому, что используется декодирование этого представления
  в целевой список товаров, можно с большой уверенностью предполагать,
  что эта размерность МЕНЬШЕ чем размерность ЦЕЛЕВОГО пространства.
  
  Почему на это акцентируется внимание?
  Дело в том, что при таком преобразовании в ходе "машинного обучения"
  наиболее явно и проявляется "магия", "химия" - называйте как хотите -
  но это самое свойство "обобщения" нейронных сетей.
  Как именно толком никто не знает, есть только разрозненные наблюдения,
  и какие-то полуэмпирические, полуэвристические рекомендации
  как этим лучше воспользоваться.
  
  Это не совсем "статистика", в привычной классической терминологии,
  это именно "машинное обучение" - технология,
  которую человечество открыла для себя "как Колумб Вест-Индию",
  но еще не осознало "как Америку".
  
  И в этой связи технология "эмбеддингов" в "скрытом",
  точнее "свернутом" пространстве,
  на мой взгляд, может подсказать очень многое в вопросе того,
  почему большие языковые модели УЖЕ не стоит считать
  простыми "статистическими попугаями".
  Если это и "статистика", то качественно иного уровня,
  чем это излагается в той же Вики.
  
  Если кого-то этот фрагмент привлек к вопросу о том,
  что же "зверь" такой этот эмбеддинг,
  то могу посоветовать начать с ознакомления с такими материалами из других модулей:
  "Эмбеддинги простыми словами."
  "Неплохая информация от практиков самопального эмбеддинга."
  "Еще пару бит информации от практиков самопального эмбеддинга."
  
  Главное, что мне хотелось бы донести в этих последних фрагментах,
  что упование на УЖЕ ИЗВЕСТНЫЕ формулы статистики
  в понимании "тайны двух океанов"
  - языка и мышления-,
  то бишь генеративных больших языковых моделей (LLM),
  МАЛО ПРОДУКТИВНО.
  
  Можно сколько угодно произносить "халва. халва",
  то бишь статистический попугай",
  но к пониманию того почему LLM "отличаются умом и сообразительностью",
  точно не приблизиться.
  Поэтому и предлагается, начать с анализа работы
  представления эмбеддингов в "свернутом" пространстве.
  
  
  ===========
  
  31.01.2024 16:36
  
  Советы авторам текстов от редактора Хабра.
  В оглавление.
  
  С учетом того,
  что большую часть материалов для работы по проекту берется с портала Хабр,
  представляют несомненный интерес, как минимум, для меня,
  те советы, которые настойчиво рекомендуются редакцией портала,
  своим постоянным и новым авторам:
  
  "10 <золотых> советов авторам любых текстов".
  Автор: Exosphere
  https://habr.com/ru/companies/habr/articles/790244/
  31 янв 2024 13:03
  
  Ничего не сокращаю, так как советы вполне разумные,
  которым и мне самому стоит придерживаться, если ставится задача,
  научиться писать более интересно и, в тоже время, информативно.
  
  //// Начало цитирования.
  
  Чем активнее мы курируем авторов,
  тем больше <налипает> опыта и своего, и чужого:
  кто-то приносит нам шедевры, кто-то - тексты,
  которые просто невозможно опубликовать.
  И вроде каждый случай особенный,
  но все проблемы и находки вполне себе поддаются систематизации.
  А значит, можно выделить лучшие практики,
  которые помогут всем сделать тексты лучше.
  Начнём с базовых моментов,
  которые, тем не менее, даже у опытных авторов соблюдаются далеко не всегда.
  
  1. По возможности используйте короткие предложения
  
  Короткие предложения приближены к разговорной речи.
  Таким образом,
  читатель понимает и легко воспринимает текст.
  Даже если информации много и она сложная,
  делите её на части.
  Кстати, короткие предложения лучше <цепляют> внимание,
  когда читатель смотрит текст по диагонали
  (как это нередко бывает на Хабре).
  //// Т.е. используемый мной способ форматирования текста,
  //// вполне, можно считать развитием этого тезиса.
  
  Сравните:
  
  Исходя из того, что Python является доступным и понятным языком программирования,
  по которому можно найти огромное количество обучающей литературы,
  на котором есть тысячи репозиториев,
  который можно встретить на классных бесплатных курсах
  и который имеет массу полезных библиотек,
  можно смело рекомендовать его как первый язык для изучения программирования.
  
  Python отлично подходит как первый язык программирования.
  Во-первых, это огромное количество готовых библиотек и кода для изучения.
  Во-вторых, масса учебной литературы, статей, туториалов.
  В-третьих, есть приличные бесплатные курсы по Python.
  Наконец, он просто доступный и понятный.
  
  2. Делите текст на абзацы
  
  Почему-то и на Хабре, и в других онлайн-изданиях
  авторы экономят онлайн-пространство
  и пишут тексты одной простынёй.
  Особенно круто это выглядит с формулами и инлайн-кодом
  - настолько круто, что хочется закрыть текст
  и не продираться сквозь эти дебри.
  
  Когда вы делите текст на смысловые абзацы через перевод строки,
  статья выглядит проще:
  кажется, что на чтение нужно не так уж много времени.
  Читатель спокойно проходит по <ступенькам> текста
  и усваивает гораздо больше информации.
  К тому же, меньше шансов потерять фокус чтения при скролле текста.
  
  3. Работайте с заголовками
  
  Мы бесчисленное количество раз говорили про заголовки на семинарах,
  в мануалах и даже в справке.
  Но нет, каждый день десятки текстов выходят с крайностями:
  либо номинативный заголовок
  (<С++: всё, что нужно знать новичкам>),
  либо жёлтизна и кликбейт
  (<Не учите С++ в 2024>).
  Оба варианта крайне плохи.
  Мимо первого читатель пройдёт и выберет чтиво поинтереснее,
  а второй не вызовет ничего,
  кроме раздражения и желания поставить минус за преднамеренный обман.
  
  Хороший заголовок - это композиция,
  которая задаёт тему,
  намекает на содержание
  и сохраняет интригу.
  Иногда над заголовком для хорошего текста приходится думать
  не 10-20 минут, а даже целый день -
  в фоновом режиме (кстати, именно <в фоне> рождаются лучшие версии).
  
  Заголовок должен быть ёмким,
  не перегруженным,
  цепляющим (желательно ассоциативным или метафоричным),
  отражающим суть
  (либо интригующим на 100%),
  интересным.
  Заголовок не должен вводить в заблуждение,
  запугивать,
  содержать бесцельную игру слов,
  не иметь ничего общего с материалом.
  
  Смысловой заголовок
  <С++: всё, что нужно знать новичкам>
  
  Плохо
  <Не учите С++ в 2024>
  
  Хорошо
  <С++: уровень программирования для сильных духом>
  <С++: да изучит сильнейший>
  
  Смысловой заголовок
  <Все забывают про бэкапы>
  
  Плохо
  <Никто не делает бэкапы>
  <Бэкапы мертвы>
  
  Хорошо
  <Где бэкап, чуваки?>
  <#@&!, где бэкап?>
  
  Смысловой заголовок
  <Думай, как пользователь, иначе - провал>
  
  Плохо
  <Делай для дурака>
  <Ваш интерфейс - лажа>
  
  Хорошо
  <Чёрт ногу не сломит: законы хорошего интерфейса>
  <Волшебный клубок: как помочь пользователю не заблудиться>
  
  4. Не бойтесь своего голоса
  
  Каждый из нас говорит со своей интонацией,
  оборотами, фирменными словечками, юмором.
  Точно так же особенно каждый пишет
  (например, посмотрите, как отличаются тексты автора и редактора
  в нашем канале Технотекст),
  и это здорово.
  Не бойтесь использовать свой стиль и <голос автора> во время письма.
  Напротив, стиль, форматы, подача
  сделают вас узнаваемым автором,
  сформируют ядро читателей
  и даже поклонников.
  Не поверите, но вас будут ждать.
  
  Вот примеры статей авторов со своим стилем и голосом:
  
   Milfgard
  https://habr.com/ru/users/Milfgard/publications/articles/
  
   steanlab
  https://habr.com/ru/users/steanlab/publications/articles/
  
   vvvphoenix
  https://habr.com/ru/users/vvvphoenix/publications/articles/
  
   nmivan
  https://habr.com/ru/users/nmivan/publications/articles/
  
   Boomburum
  https://habr.com/ru/users/Boomburum/publications/articles/
  
  5. Не думайте о трафике и SEO
  
  Забота о поисковой выдаче сразу заметна:
  текст насыщается правильно расставленными ключевиками,
  появляется какая-то роботность,
  излишняя продуманность.
  Читаешь такой текст
  - и внутри скребёт подлое ощущение,
  что автор говорит не с тобой,
  что у него какая-то другая цель.
  Да, старания сеошников понятны,
  но всё же вы пишете для читателей.
  А хороший, полезный текст читатель всегда найдёт.
  
  К тому же, <напихивать> оптимизацию в тексты
  - дело неблагодарное:
  вместе со сменой поискового алгоритма
  придут новые правила и паттерны индексирования,
  которым ваши ключевики покажутся заспамленностью,
  а сам текст - для машин писаным.
  И пойди докажи поисковой выдаче,
  что ты имел в виду совершенно другое
  и текст честно-честно писал не ChatGPT.
  
  Инвестиции в российские ценные бумаги остаются интересным инструментом
  для частного инвестора, поскольку выполняют все функции:
  формирование портфеля, диверсификацию рисков,
  формирование стратегий доходности.
  Все, кто готов на инвестиции в российские ценные бумаги,
  могут заработать деньги не выходя из дома,
  получая пассивный доход.
  //начало текста об инвестициях с SEO
  
  Кажется, что российские ценные бумаги растеряли доверие
  вместе со стоимостью в начале 2022 года.
  Однако, если посмотреть котировки и динамику на Московской бирже,
  можно увидеть, что есть задел для формирования как рисковых,
  так и стабильных портфелей.
  При этом в долгосрочной перспективе такие инвестиции
  как раз часть пассивного дохода,
  о котором мы все немного мечтаем.
  //начало того же текста без SEO, смыслы более вовлекающие
  
  6. Тренируйтесь как автор
  
  Все мы знаем, как тренируются спортсмены:
  подходы, регулярность, нагрузка, результат.
  Чуть меньше знают,
  как тренируются хирурги,
  ещё меньше - как тренируются другие врачи,
  ещё меньше знают о других профессиях.
  Между тем, формирование навыков и развитие
  везде работает по одному принципу:
  практика, подходы, любознательность, закрепление.
  Авторские <мышцы> тоже можно натренировать.
  
   Читайте разные форматы:
   книги, журналы, онлайн-статьи на разные темы.
   Обращайте внимание на подачу, вёрстку, стиль авторов,
   выделяйте то, что вам нравится.
   Например, для меня многолетним маяком и ориентиром
   является журнал <Наука и жизнь>,
   а из последних неоднозначных и любопытных вдохновителей
   - новый (уже не новый) формат РБК и особенно <Правила жизни>.
   И тем круче соединять классический научпоп
   и поиск ироничных, новых форматов.
  
   Не ограничивайтесь тем, что знаете и чем интересуетесь
   - попробуйте погрузиться в совершенно неожиданную тему.
  
   Проводите мозговые штурмы с самим собой:
   накидывайте идеи, а затем применяйте критическое мышление
   и выбирайте лучшие варианты.
  
   Тренируйте насмотренность:
   научите себя замечать интересные изображения, фразы, сюжеты из жизни.
   Записывайте наблюдения в заметки или в бумажный блокнот.
   Поверьте, они сослужат вам добрую службу.
  
  7. Задавайте себе вопросы
  
  Даже если вы знаете тему блестяще,
  задайте себе вопросы, чтобы определиться с оптимальной подачей.
  Эти же вопросы помогут разобраться с темой, если она вам незнакома.
  
   Что я уже знаю по этой теме?
  
   Зачем я взялся именно за эту тему?
  
   Чего я не знаю по этой теме?
  
   Что предстоит уточнить и узнать?
  
   Почему тема интересна читателям?
  
   Что читатели получат от темы в моём исполнении?
  
  На первый взгляд может показаться, что такие вопросы
  способны вызвать синдром самозванца
  и похоронить идею авторства в принципе.
  Но нет - скорее, это пункты будущего плана
  (кстати да, вопросный план тоже существует).
  Честно себе ответьте и действуйте.
  
  8. Участвуйте в конкурсах
  
  Конкурсов текстов много,
  но вписаться в некоторые из них
  ровным счётом невозможно из-за требований:
  то нужно быть издаваемым,
  то писать в стиле офисного детектива и прочее.
  Но, к счастью, и компании, и сами издатели
  периодически проводят гласные и негласные конкурсы статей
  (например, отбирая авторов себе в пул или ради мотивации).
  Так, Хабр проводит конкурс <Технотекст>,
  который призван не только выявить лучших авторов,
  но помогает мотивировать и обучить тех,
  кто только приходит в техноавторство.
  
  Это не школьные экзамены и не диплом,
  поэтому участвуйте, запрашивайте рецензии,
  обращайте внимание на конкурентов,
  обучайтесь и становитесь лучше.
  
  9. Не сотворите себе кумира
  
  Работая с текстами почти 10 лет,
  я вижу редакторов и авторов,
  которые спят с книгами Д. Шугермана, Д. Огилви, М. Ильяхова, Н. Галь.
  Не раз приходилось видеть совершенную дикость,
  когда автор добавлял к статье баллы по Ильяхову,
  а хороших авторов заворачивали только потому,
  что их тексты не соответствуют инфостилю.
  Уместность?
  Нет, не слышали.
  
  Перечитайте пункт 4 этой статьи:
  ориентируйтесь на свой стиль и оттачивайте его.
  Читать перечисленных авторов - обязательно,
  брать у них лучшие идеи - тоже.
  Слепо поклоняться и сверяться не стоит.
  Это может привести к обеднению,
  истощению ваших текстов,
  потере авторского лица.
  Надеюсь, редакторы тоже читают этот пункт.
  
  10. Формируйте здравую самооценку
  
  Если вам кажется,
  что вы опровергли теорию относительности,
  вам кажется;
  если вы считаете евгенику доказательной медициной,
  вы ошибаетесь;
  если вы уверены,
  что на Хабре никто никогда не писал про фронтенд-фреймворки,
  перечитайте Хабр.
  Точно так же,
  как если вы написали крутую статью,
  не нужно её держать в столе или в Google Docs
  - явите её миру.
  Главное, умейте понимать, насколько ценны ваши тексты
  - а если есть сомнения,
  пишите в личку мне @Exosphere , Кате @Markaty
  или на почту neo@habr.team
  //// Ну вот еаконец хоть один мэйл на Хабре все-таки есть.
  
  И это... будьте осторожнее с генеративными нейросетями.
  Вы даже не представляете,
  насколько дёшево и бездарно выглядят для читателей
  написанные с их помощью тексты.
  Уважайте себя,
  свои человеческие способности,
  свой человеческий мозг
  - эта штука в черепной коробке реально способна на многое.
  
  P.S. Почти все поступившие на сегодня заявки на <Технотекст> приняты,
  скоро у всех появятся бейджи.
  И у вас ещё много времени, чтобы подать свою статью
  или даже специально написать конкурсную.
  
  ........
  
  //// И самое интересное из комментариев.
  
  ChePeter
  3 часа назад
  
  Забыли главный совет - Никогда не копипасти чатГПТ
  0
  
  Exosphere
  3 часа назад
  
  В последнем абзаце иронизируем над этим.
  Про текстовые нейронки готовим отдельный материал,
  потому что это ну боль!
  0
  
  ........
  
  Yukr
  1 час назад
  
  можно предложу 11 пункт ?
  
  Берегите читателей!
  если можете - не пишите.
  Регулярно обнуляйте ЧСВ ))
  0
  
  .......
  
  Daddy_Cool
  
  2 часа назад
  
  Вот да. 10-й совет - хм...
  Если я захочу написать статью о том как выводить "Hello, world!" на Си,
  скорее всего у меня будут важные соображения почему "это другое" (ТМ).
  (Как крайний случай - см. "Пьер Менар, автор <Дон Кихота>" Х. Л. Борхеса).
  
  А про вечные двигатели и велосипеды
  - читать такое полезно для оттачивания критического мышления.
  
  ......
  
  //// Конец цитирования.
  
  Вот, вроде все понятно, но чтобы следовать этим правилам "на автомате",
  нужно "учится, учиться и еще раз учиться".
  И, самое главное, не бояться признавать свои ошибки,
  которых у меня точно немало.
  Ладно, "будем посмотреть", повлияет хоть как-то этот текст,
  и на мои опусы, и на материалы, размещаемые на портале,
  или для этого еще не пришло время.
  
  
  =========
  
  31.01.2024 19:15
  
  Тексты ИИ-моделей пока более "плоские" чем авторские.
  В оглавление.
  
  Развитие ИИ-систем и, в частности, больших языковых моделей,
  так или иначе подталкивают необходимость использования новых подходов
  даже в "устоявшихся" областях научного знания.
  Правда, иногда это происходит даже вопреки желанию сохранить
  "традиционные" представления.
  
  Вот пример такой ситуации, когда от традиционного статистического описания текстов
  осторожно переходят к структурному топологическому представлению.
  Очень характерно при этом, что цифровые эмбеддинги текста рассматриваются
  как пространства, в общем случае, дробной размерности,
  т.е. как фрактальные, точнее, мультифрактальные структуры.
  
  Интересно, сколько бы потребовалась бы статистической лингвистике времени
  и "высоконаучных" споров, чтобы искать какие-то новые подходы,
  если бы развитие ИИ-систем не поставило перед человечеством
  новые, актуальные и сложные задачи:
  
  "Устойчивые гомологии помогли надёжно определить
  машинное происхождение текстов".
  Авторы: Евгений Бурнаев и Марат Хамадеев
  https://airi.net/ru/blog/persistent-homology/
  AIRI
  18.12.2023
  
  //// Начало цитирования.
  
  С каждым годом появляются всё новые нейросетевые языковые модели,
  а сгенерированные ими тексты становится всё сложнее отличить
  от написанных человеком.
  Уже сейчас это помогает сильно упрощать множество сфер человеческой деятельности.
  В то же время, развитие этих технологий снижает ценность и доступность
  авторских - то есть, написанных человеком - текстов.
  Эта проблема особенно актуальна для образования и творческих профессий.
  
  Перед экспертами в области машинного обучения естественным образом встает задача
  обнаружения искусственно сгенерированных текстов
  (artificial text detection, ATD).
  Такие методы стали активно появляться в последние годы,
  но они не универсальны - в большинстве своём,
  ориентированы на противодействие конкретным генерирующим моделям;
  также они имеют и иные ограничения.
  Некоторые исследователи призывают разработчиков
  внедрять статистические искажения в выдачу модели,
  создав таким образом аналог водяных знаков для текстов;
  кто-то предлагает централизованно хэшировать каждый генерируемый текст,
  чтобы потом облегчить его обнаружение.
  Наконец, есть и те, кто высказывает мнение,
  что создать идеальный детектор ИИ-текстов невозможно.
  https://arxiv.org/abs/2303.11156
  
  Команда исследователей из нескольких российских институтов
  не готова сдаваться так быстро.
  Учёные обнаружили,
  что определённые численные представления достаточно длинных текстовых отрывков
  имеют весьма примечательную геометрию.
  В частности, как выяснилось, одна из её статистик
  - так называемая внутренняя размерность -
  //// Тут очень характерно желание сохранить преемственность
  //// с "добрым старым статистическим" подходом:
  //// представление "внутренней размерности" именно как "статистику".
  может служить достаточно надёжным индикатором того,
  <естественный> ли это текст
  (то есть, написанный человеком)
  или же он <искусственный>
  (сгенерированный при помощи нейросетевой модели).
  На основе этого наблюдения команда смогла создать
  надёжный и универсальный детектор <искусственных> текстов.
  
  Рис. Схематическое представление основной идеи:
  представление сгенерированного текста (слева)
  имеет меньшую внутреннюю размерность,
  чем представление текста, написанного человеком (справа)
  
  Другие исследователи, работающие в данной области,
  уже предлагали обращаться к размерностям многообразий,
  построенных на базе разных представлений данных
  либо весов нейросетевых моделей.
  Но даже если предположить, что набор данных
  лежит на некоторой поверхности в многомерном пространстве,
  оценить её размерность нелегко
  из-за различного рода шума в данных
  //// Вот опять "маркер статистического подхода":
  //// рассмотрение индивидуальных особенностей текста как "шум".
  и неравномерного распределения набора точек.
  
  Авторы нового подхода предложили вместо этого
  оценивать геометрию каждого текста как отдельного объекта,
  естественно,
  если он достаточно длинный (порядка 200 слов или более)
  и достаточно осмысленный.
  Произведённые современными языковыми моделями тексты
  содержат очень мало грамматических, синтаксических
  или локальных семантических несоответствий
  и, как правило, вполне соответствуют этим условиям.
  
  В соответствие с предложенным методом,
  первым делом текст пропускается
  через предварительно обученную трансформерную модель,
  и на выходе получается набор контекстно-зависимых эмбеддингов
  - по одному для каждого токена текста
  (знака препинания, слова или его части,
  если оно целиком не входит в ограниченный словарь модели).
  С точки зрения математики такой эмбеддинг
  - это вектор фиксированной длины
  (или же просто точка в евклидовом пространстве),
  численное значение которого обусловлено как самим токеном,
  так и его контекстом.
  
  Следующий шаг - оценить размерность многомерной поверхности,
  на которой лежит этот набор точек
  - представляет изрядную сложность.
  Дело в том, что геометрические представления реальных данных
  очень часто демонстрируют иерархическую структуру,
  и их размерность зависит от масштаба,
  на котором они исследуются.
  Поэтому, в качестве приблизительной оценки,
  часто используются те же приёмы, что и для оценки сложности фракталов.
  //// Вот ключевой сдвиг от чистой статистики - переход к "фрактальности".
  //// Т.е. это уже не просто "статистика" а "статистика с внутренней структурой".
  
  Существуют множество способов оценить внутреннюю размерность,
  и их различия обусловлены разными предположениями о структуре данных.
  Авторы статьи сравнили результаты их применения
  к контекстно-зависимым эмбеддингам текстов
  и затем предложили новый метод,
  основанный на концепте персистентных гомологий
  (persistent homology)
  из топологического анализа данных.
  //// Вот еще один следующий шаг уже в отношении применения "фрактальности":
  //// оценка не столько по "геометрическим" характеристикам, а по "топологическим".
  //// Правда, он тут не до конца "топологический",
  //// так как сама оценка "фрактальности", насколько я понял,
  //// базируется вс-таки на "геометрической" оценке.
  /////// В последнем тезисе до конца не уверен, так как точно перевести
  /////// этот момент в авторской статье у меня не получается,
  /////// а "на языке родных осин" авторы не считают нужным представлять
  /////// текст своей "революционной" статьи.
  /////// Ограничиваясь вот такой "выжимкой" для "бестолковых".
  Как показали эксперименты, предложенный ими метод
  - Persistence Homology Dimension -
  оказался более устойчивым к смене стиля или длины текста,
  а также различным видам лингвистического шума.
  
  Исследователи работали с двумя корпусами текстов:
  <естественных> и <искусственных>,
  то есть сгенерированных различными языковыми моделями.
  Первый был собран из текстов разных стилей и из разных источников,
  включая статьи из Википедии, посты на Reddit'е
  и вопрос-ответы в разных областях знания с сайта StackExchange.
  <Искусственные> тексты были созданы по-разному,
  в зависимости от конкретной задачи,
  но большинство - это либо развёрнутые ответы на вопросы,
  либо сгенерированные продолжения коротких отрывков
  (в два предложения).
  Использовались разные модели текстовой генерации:
  GPT2-XL, OPT13b, GPT3.5.
  
  Главное, что показали эксперименты
  - уверенное различие внутренней размерности для текстов,
  написанных человеком и машиной.
  Наибольшей размерностью обладали итальянские и испанские человеческие тексты
  (10 +- 1), наименьшей - японские и китайские (7 +- 1).
  Однако, независимо от языка, машинный текст демонстрировал,
  в среднем, на полторы единицы меньшую размерность
  с хорошей статистической значимостью.
  
  Рис. Внутренняя размерность <натуральных> текстов на разных языках
  
  В ходе экспериментальной проверки метод, предложенный исследователями,
  превзошёл другие ATD-методы,
  в том числе, GPTZero и OpenAI detector,
  предоставленный создателями ChatGPT.
  Новый подход продемонстрировал ещё одно важное преимущество:
  меньшую предвзятость к текстам от не носителей языка.
  
  Код и данные выложены на GitHub,
  а подробности исследования можно узнать из статьи,
  опубликованной в сборнике трудов конференции NeurIPS 2023.
  https://openreview.net/forum?id=8uOZ0kNji6
  
  //// Конец цитирования.
  
  С одной стороны, приятно чувствовать себя автором более "выпуклых"/"лохматых" текстов,
  а к тестам, сгенерированным ИИ-моделями, относится как более "плоским"/"приглаженными",
  хотя они и более грамматически правильны и, наверно, лучше структурированы.
  Но, с другой стороны, представляется, что эта ситуация чисто временная,
  так как внедрение в тексты ИИ-моделей элементов,
  которые все эти статистические характеристики будут успешно "имитировать",
  это достаточно понятная и, возможно, не такая уж сложная задача.
  Именно потому, что известна "методика статистической оценки" известна.
  Так что, ценность этой работы именно в отношении детектирования ИИ-текстов,
  достаточно относительна.
  
  А вот то, что в этой работе начинается переход к представлению текстов,
  как ТОПОЛОГИЧЕСКОМУ пространству с фрактальной/дробной размерностью,
  наверно, стоит оценить по достоинству.
  Меня кроме того радует, что в своих "измышлизмах",
  относительно какого-то иного подхода к представлению "пространства текста"
  очень много элементов согласующихся с "последним словом науки", см.:
  "Каково же оно "пространство эмбеддингов" нейронки?"
  
  В общем, меня лично, очень заинтересовал этот подход,
  но, к сожалению, знаний/понимания того,
  что есть такое "персистентные топологические гомологии" нет никакого.
  И что с этим делать - не знаю.
  Даже Бинг отказался давать разъяснения, справедливо указав,
  что мне нужно сильно "подтянуть" свою математическую подготовку,
  чтобы понять эту математическую абстракцию.
  Ладно, будем продолжать поиск.
  
  
  =========
  
  03.02.2024 12:22
  
  Эмбеддинги отдельных терминов VS эмбеддинги окружения.
  В оглавление.
  
  Предлагаю Вашему вниманию достаточно сложную для понимания статью,
  но очень полезную в плане понимания того как сейчас в основном представляется,
  каким образом формируется значение эмбеддинга отдельного слова:
  
  "Разбор статьи о том, как извлечь смыслы из эмбеддингов".
  Автор: aarmaageedoon (Буянов Игорь)
  https://habr.com/ru/articles/509092/
  2 июл 2020 в 11:29
  
  //// Начало цитирования
  
  Упрощенный разбор статьи, в которой автор предлагает две интересные теоремы,
  на базе которых он нашел способ
  как из матрицы эмбеддингов
  извлечь скрытые векторы смыслов.
  
  .......
  
  Введение
  
  В этой статье я хочу рассказать об одной потрясной вещи,
  которую нашел исследователь Санджев Арора в статье
  Linear Algebraic Structure of Word Senses, with Applications to Polysemy.
  https://arxiv.org/abs/1601.03764
  Она является одной из серии статей,
  в которых он пытается дать теоретические обоснования свойства эмбеддингов слов.
  В этой же работе Арора делает предположение о том,
  что простые эмбеддинги, такие как word2vec или Glove,
  на самом деле включают в себя несколько значений
  для одного слова и предлагает способ как можно их восстановить.
  По ходу статьи я буду стараться придерживаться оригинальных примеров.
  
  Более формально, за $\upsilon_{tie}$ обозначим
  некий вектор эмбединга слова tie,
  которое может иметь значение узла или галстука,
  а может быть глаголом "завязать".
  Арора предполагает, что этот вектор можно записать,
  как следующую линейную комбинацию
  
  $ \upsilon_{tie} \approx \alpha_1 \upsilon_{tie1} + \alpha_2 \upsilon_{tie2} + \alpha_3 \upsilon_{tie3}+... $
  
  где $\upsilon_{tien}$ это одно из возможных значений слова tie,
  а $\alpha$ - коэффициент.
  Давайте попробуем разобраться, как же так получается.
  
  Теория
  
  Дисклеймер
  
  Небольшая заметка о теории Ароры
  
  Поскольку стартовая работа Ароры куда сложнее, чем эта,
  я пока не подготовил обзор полностью.
  Однако, мы вкратце посмотрим, что она из себя представляет.
  
  Итак, Арора предлагает идею,
  согласно которой любой текст порождается генеративной моделью.
  В процессе ее работы на каждом временном шаге $t$ генерируется слово $w$.
  Модель состоит из вектора контекста $с$ и векторов эмбеддингов $u_w$.
  В отдельных размерностях(dimensions),
  или координатах, вектора кодируется информация и атрибуты слов.
  Например, мы могли бы сказать, что в каком-то абстрактном векторе
  положительное значение пятой размерности отвечает за мужественность
  (мужчина, король),
  а отрицательная - за женственность
  (женщина, королева),
  а положительное значение сотой размерности говорит о том,
  что слово будет глаголом,
  а отрицательное - существительным.
  
  Вектор контекста совершает медленное равномерно распределенное
  случайное блуждание,
  т.е. с течением времени значения его координат изменяются на какой-то вектор,
  семплированный из равномерного распределения.
  Таким образом кодируется информация о чем в данный момент идет речь.
  Условия медленной скорости и равномерности процесса нужны для того,
  чтобы слова близкие по смыслу имели большую вероятность
  быть сгенерированными вместе.
  Другими словами это условие позволяет генерировать взаимосвязнный текст:
  последовательность слов "Девушка расчесывала свою косу"
  имеют большую вероятность быть сгенерированной,
  чем "Мужчина расчесывает свою косу".
  Однако, модель не налагает строгий запрет на "прыжки":
  в конце концов, некоторые мужчины действительно носят длинные волосы.
  
  В отличие от вектора контекста, векторы эмбедингов статичны.
  По сути, это такие отображения,
  которые позволяют сопоставлять слово с конкретным набор информации,
  которая закодирована в координатах векторов.
  
  Процесс генерации текста очень прост:
  двигаясь в пространстве векторов вектор контекста
  становится ближе то к одному слову, то к другому.
  Вероятность того, что на шаге $t$ будет сгенерировано слово $w$
  определяется выражением
  
  $ P(w|c_t) = \frac{1}{Z_c}\exp{} $
  
  где $c_t$ - вектор контекста на время $t$,
  $\upsilon_w$ - эмбеддинг слова $w$,
  а $Z_c = \sum_w\exp$ - это partition function.
  Она выполняет роль нормализатора,
  который дает гарантии, что мы получим валидную вероятность.
  
  Теперь на примере картинок попытаемся это понять
  на максимально простом примере.
  Допустим, у нас есть двумерное пространство,
  в котором всего эмбеддинги для четырех слов:
  королева, король, женщина, мужчина.
  Мы могли бы закодировать информацию о статусе по оси Y,
  а по X закодировать пол.
  Тогда картинка могли бы выглядеть следующим образом
  
  .....
  
  Теперь нам нужен вектор контекста.
  Это будет просто отдельная точка около какого-то вектора,
  которая оказалась там на каком-то временном шаге. Вот она
  
  ......
  
  Теперь, давайте представим, что он медленно двигается.
  Условимся, что это значит,
  что он не может за отсчет пройти расстояние больше единичного и без "прыжков".
  Тогда траектория могла бы выглядеть так:
  
  ......
  
  Получается, что такой обход по контуру квадрата сгенерирует нам текст
  "Королева, король, мужчина, женщина".
  В данном случае, для нашей простой модели именно такой текст
  является взаимосвязнным,
  поскольку изменять расстояние мы можем не больше чем на единицу,
  значит получить текст "королева, мужчина, женщина, король" мы не можем,
  потому что они "как бы" не так сильно связаны статистически.
  
  Возвращаемся
  
  Арора начал с того, что внёс модификацию в его генеративную модель
  из прошлой статьи.
  В новой модели он предлагает заменить равномерное распределение,
  по которому движется вектор контекста, Гаусовским.
  Это порождает некоторые изменения в выкладках из первой части,
  но мы их рассматривать не будем
  (на данный момент, во всяком случае).
  Далее, базируясь на этой модели, он выдвигает и доказывает две теоремы.
  Я приведу их здесь без доказательства.
  
  Теорема 1
  
  Предполагая выше описанную модель,
  пусть $s$ это случайная переменная для окна длинной $n$ слов.
  Тогда существует линейное преобразование $A$ такое, что
  
  $ \upsilon_w \approx A \mathbb{E}[\frac{1}{n}\sum_{w_i\in s}\upsilon_{w_i}|w \in s] $
  
  Это значит, что между неким словом и его окном
  существует линейная зависимость.
  В статье рассматривается следующий мысленный эксперимент.
  Давайте возьмем некое слово $w$ и соберем для этого слова все окна.
  Множество всех окон обозначим за $S$.
  Затем, возьмем среднее $\upsilon_s$ каждого окна $s \in S$,
  а затем возьмем среднее от всех средних по окнам и обозначим это $u$.
  Тогда, согласно теореме, мы можем отобразить этот вектор $u$
  в $\upsilon_w$ при помощи некой матрицы $A$
  (которую еще найти надо).
  Тут следует сказать, что если такую матрицу найти,
  то это сократило бы проблемы out-of-vocabulary слов,
  поскольку посчитать среднее от всех окон и помножить это на матрицу
  явно проще, чем полностью переобучать все векторы с нуля.
  
  Арора проводит эксперимент, чтобы проверить это.
  Для его понимания, необходимо понятие SIF эмбеддингов.
  Хотя в данной статье и есть про них заметка,
  вообще, им посвящена отдельная статья,
  которую я тоже разберу позже.
  Сейчас же будет достаточно знать,
  что SIF эмбеддинги $\upsilon_{SIF}$ это эмбеддинги для окна текста k,
  который считается как среднее от эмбеддингов,
  входящих в это окно слов $w$,
  умноженных на их TF-IDF.
  //// А это еще что? Опять какой-то "всем хорошо известный" термин.
  \\\ TF-IDF (от англ. TF - term frequency, IDF - inverse document frequency)
  \\\ - статистическая мера, используемая для оценки важности слова
  \\\ в контексте документа...
  
  $ \upsilon_{SIF}=\frac{1}{k}\sum^k_{n=1}\upsilon_n*tf\_idf(w_n) $
  
  К слову, оказывается, что с позиции теоремы 1,
  эти эмбеддинги являются максимальной оценкой правдоподобия
  для вектора контекста $c$.
  Как вы могли заметить,
  это и самый простой способ построить эмбеддинг какого-то куска текста,
  например, предложения.
  
  Возвращаясь обратно к эксперименту.
  Представим, что у нас есть матрица эммбеддингов и какое-то слово $w$,
  для которого нет эмбеддинга $\upsilon_w$ в матрице,
  но мы хотим его посчитать.
  Алгоритм будет выглядеть следующим образом:
  
   Случайно выберем много параграфов из Википедии.
   Обозначим словарь всего такого подкорпуса $V$.
  
   Для каждого слова $w' \in V$,
   для которых известны эмбеддинги,
   и всех их вхождений среди параграфов по отдельности
   посчитаем SIF эмбеддинги для окон в 20 слов с центром в $w'$,
   используя нашу известную матрицу эмбеддингов.
   В итоге для каждого слова $w' \in V$ мы получим
   множество векторов $(\nu_{w'}^1, \nu_{w'}^2,, ... \nu_{w'}^n,)$,
   где n - количество вхождений слова $w'$ в подкорпусе.
  
   Посчитаем среднее $u_{w'}$ всех SIF эмбеддингов
   для каждого слова $w' \in V$
   по формуле $ u_{w'}=\frac{1}{n}\sum_{t=1}^n\nu_{w'}^t$.
  
   Решаем регрессию $argmin_A\sum_A||Au_{w'}-\upsilon_{w'}||^2_2$
  
   Берем среднее всех SIF эмбеддингов для нашего неизвестного слова
   и считаем $\upsilon_w=Au_w$
  
  Арора показывает, что эти т.н. индуцированные эмбеддинги
  довольно хорошо приближены к своим оригиналам.
  Он подсчитал таким образом эмбеддинги для 1/3 слов от известной матрицы,
  произведя обучение матрицы A на оставшихся 2\3 части.
  В таблице ниже представлены результаты из оригинальной работы.
  Обратите внимание на количество параграфов.
  
  #paragraphs 250k 500k 750k 1 million
  cos similarity 0.94 0.95 0.96 0.96
  
  Теорема 2
  
  Предположим, что существует некое слово $w$
  с двумя разными значениями $s_1$ и $s_2$.
  Получим вектор $\upsilon_w$ для этого слова на каком-нибудь корпусе,
  где присутствуют оба этих значения.
  Затем, в этом же корпусе вручную проставим метки для этих значений,
  т.е. искусственно переделаем слова в псевдослова,
   например, tie_1 и tie_2,
  где слово tie_1 - это для значение для галстука,
  а tie2 - для узла.
  
  Для нового корпуса с нашими псевдословами снова посчитаем эмбеддинги
  и обозначим их, соответственно,
   $$
  и $$.
  Вновь, предполагая нашу генеративную модель, теорема утверждает,
  что эти эмбеддинги будут удовлетворять
  $\lVert\upsilon_w - \upsilon^- \rVert \rightarrow 0$,
  где $\upsilon^-$ определяется как
  
  $ \upsilon_w^- = \frac{f_1}{f_1+f_2} * \upsilon_{s1} + \frac{f_2}{f_1+f_2} * \upsilon_{s2} = \alpha\upsilon_{s1} + \beta\upsilon_{s2} $
  
  где $f_1$ и $f_2$ это число вхождений значений $s_1$ and $s_2$ в корпус.
  Как вы можете видеть,
  это ровно то же выражение, как и в начале статьи.
  //// Насколько я понимаю это, получается, что разные смысловые эмбеддинги
  //// просто складываются?
  
  Окей, все это, конечно, хорошо,
  но как мы можем восстановить эту линейную комбинацию значений слова?
  Их может существовать же гигантское количество
  даже при условии, что мы будем знать $alpha$.
  На помощь нам снова придет генеративная модель.
  Предположим, что вектор контекста $c$ сейчас находится
  рядом с темой о девушках
  и следовательно о них модель и будет генерировать текст.
  Тогда логично предположить, что если в данный момент появится слово коса,
  то оно будет иметь значение прически.
  Более того, такие слова, как глаза, наряд, красивая, платье
  должны генерироваться с высокой вероятностью.
  Также, согласно нашей модели,
  эта вероятность определяется,
  как скалярное произведение(inner product)
  между вектором контекста и вектором слова.
  Тогда давайте положим, что тот вектор контекста,
  который имеет наибольшее внутреннее произведение
  со всеми контекстно-близкими словами
  (глаза, наряд, красивая, платье),
  и будет вектором для значения $\upsilon_{tie1}$ косы, как женской прически!
  Остается только извлечь эти векторы.
  
  Давайте снова поиграем в математиков.
  Что мы хотим?
  Имея набор векторов слов в $\Re^d$ и два целых числа $k, n$.
  таких что $ k < n$,
  мы хотим найти набор векторов $A_1, A_2, ..., A_m$,
  таких, чтобы
  
  $ \upsilon_w = \sum_{j=1}^m\alpha_{w,j}A_j + \mu_w $
  
  где не больше $k$ коэффициентов $\alpha$ не равны нулю
  и $\mu_w$ - вектор ошибок.
  Для решения этой задачи мы можем записать следующее оптимизационное уравнение
  
  $ \sum_w \lVert\upsilon_w - \sum_{j=1}^m\alpha_{w,j}A_j \rVert^2_2 $
  
  Эта типичная проблема разреженного кодирования,
  где k называется параметром разреженности
  (sparsity parameter),
  а m - количество т.н. атомов,
  которые в нашем случае являются теми самыми векторами.
  Это можно решить при помощи алгоритма k-SVD.
  Стоит заметить, что данная задача не чистое решение.
  Мы можем только надеяться на то,
  что среди множества $A$ существует ось,
  соответствующая определенным темам
  (у нас получается, что множество $A$ похоже на координатную систему).
  Для того, чтобы быть уверенными,
  что какой-либо атом $A_i$ участвует в выражении своего атрибута
  или темы в словах,
  выражая контекст,
  а не является болваночной осью,
  нам нужно ограничить $m$ много меньше количества слов.
  Авторы оригинальной статьи называл это атомами дискурса.
  
  //// Насколько я понял, здесь так же "на ощупь" идет поиск
  //// какого-то иного представления эмбеддингов,
  //// с опорой на какие-то "контекстные" оси.
  //// Но делается это опять же на основе "статистической концепции"
  //// представления эмбеддингов как "нечто среднее"
  //// из эмбеддингов "окружения".
  
  Практика
  
  ........
  
  В статье автор выбрал количество атомов,
  равное 2000 и параметр разреженности равный 5.
  
  Я натренировал две версии:
  первая для 10000 эмбеддингов и вторая для всех.
  Поскольку этот процесс занимает довольно много времени,
  особенно, для полной матрицы,
  я сохранил результаты, чтобы вы смогли просто их загрузить.
  
  ......
  
  Восхитительный результат!
  Выглядит похоже, что атомы являются центрами для похожих слов.
  Давайте теперь специально возьмем пару многозначных слов
  и найдем для них ближайший атом.
  
  ......
  
  Весьма неплохо!
  Мы действительно, хоть и с некоторыми ошибками,
  видим атомы, которые отражают разные значения слов.
  
  Интересно, что если это сделать на всей матрице,
  то результат будет гораздо менее точным.
  Я подозреваю, тут сказывается неопределенность задачи,
  о которой говорилось ранее.
  
  Давайте теперь попробуем тоже самое сделать и для русского языка.
  В качестве эмбеддингов возьмем fastText, предоставленный RusVectores.
  Они были натренированы на НКРЯ с размерностью 300.
  
  ......
  
  Результат тоже довольно впечатляет.
  //// Ну, у меня сложилось не такое "оптимистичное" отношение к результатам,
  //// Но это не суть важно.
  //// Какая-то связь все-таки проглядывает,
  //// хотя часто очень явное расхождение со "здравым смыслом",
  //// как это обычно бывает при использовании чистой "статистики".
  
  Заключение
  
  В обзор статьи не вошли некоторые вещи из статьи,
  такие как алгоритм для индукции смысла слов (Word sense indection),
  который базируется на всех этих выкладках,
  а также я не провел опыт для теоремы 1.
  Данная статья - один из кирпичиков в понимании того,
  как устроены эмбеддинги.
  Наперед скажу, что есть статьи которые показывают,
  что не все предположения данного автора корректны.
  Однако, удивительно,
  но эксперименты показывают, что подход работает.
  Будем смотреть, что будет дальше.
  
  .......
  
  //// Из комментариев.
  
  Arech
  2 июл 2020 в 14:53
  
  Очень интересно, спасибо!
  
  Про Теорему 1 (я, кстати, ужасно рад,
  что оказывается на хабре таки включили MathJax,
  но ЯННП как его включить в коментах, - попробую по-старинке,
  но, боюсь, не зайдёт).
  
  Формула $ \upsilon_w \approx A \mathbb{E}[\frac{1}{n}\sum_{w_i\in s}\upsilon_{w_i}|w \in s] $,
  если я правильно понял, выражает эмбеддинг слова w
  приблизительно как линейное отображение
  мат.ожидания (по всем окнам)
  среднего значения эмбеддингов всех слов в окне,
  содержащем это слово.
  Правильно ли я понимаю, что подразумевается,
  что в вычислении среднего искомый эмбеддинг \upsilon_w не включается?
  Т.е. среднее всех эмбеддингов, кроме искомого?
  0
  
  Arech
  2 июл 2020 в 14:57
  
  А вообще, всё выглядит довольно логично.
  Механизм dot-product attention,
  представленный год спустя в Трансформерах,
  тоже, по видимому, основывается на свойстве эмбеддингов,
  что смыслы спрятаны в пространстве эмбеддингов
  как-то очень близко-локально.
  Что и позволяет их находить <вблизи> запроса
  (в терминах ).
  0
  
  aarmaageedoon
  2 июл 2020 в 17:30
  
  \\\ Правильно ли я понимаю, что подразумевается,
  \\\ что в вычислении среднего искомый эмбеддинг \upsilon_w не включается?
  
  Вообще, в статье самой это не указывается,
  но по логике, искомый эмбеддинг включаться не должен.
  
  А вопрос о том, как связаны статические эмбеддинги
  с теми, что производятся на основании трансформеров
  - действительно интересен.
  Ведь получается, что матрица A из теоремы 1,
  как раз делает качественно похожие вещи,
  что делают модели на трансформерах.
  Но это только качественно.
  0
  
  .......
  
  //// Конец цитирования.
  
  В общем, данная статья как бы служит подтверждением
  и теоретически и экспериментальным,
  что эмбеддинг отдельного слова может быть как-то очень близко
  интерпретирован каким-то "усреднением" эмбеддингов слов,
  используемых вместе с ним в каком-то общем контексте.
  
  Такой вывод с одной стороны контринтуитивен,
  если подходить к эмбеддингу слова как независимой точки
  в многомерном пространстве эмбеддинга, особенно для многозначных слов.
  И тем более, если рассматривать пространство эмбеддингов
  как некий аналог человеческого представления значений слов.
  //// Но, может быть, попытка провести такую прямую аналогию
  //// сама по себе в чем-то в принципе неправильная.
  //// И нужно искать какую-то иную аналогию/подход.
  
  А с другой стороны, учитывая некоторое эмпирическое подтверждение
  в фактических значениях используемых эмбеддингов,
  может быть стоит по другому взглянуть уже на сам процесс
  формирования таких эмбеддингов в процессе обучения ИИ-системы.
  
  Одна сторона этого обучения, с формированием "новых терминов"
  затрагивалась ранее в материале:
  "Тарабарские языки", используемые ИИ-системами."
  
  А вот другая сторона этого процесса обучения,
  вполне возможно, заключается в том,
  что не только цифровое значение эмбеддинга конкретного слова
  "подтягивается" к "среднестатистическому" от эмбеддингов "слов окружения",
  но и эббединги "слов окружения" корректируются "в направлении"
  этого конкретного слова.
  
  В общем, нужно как-то по иному подойти к рассмотрению обучению ИИ-систем
  методом обратного распространения ошибки.
  Попытаться представить этот процесс не как "однолучевое" обучение
  конкретному слову в "среднестатистическом окружении",
  а как "многолучевое"/"поточное" обучение/согласование
  "среднестатистического окружения" с конкретным термином/словом/токеном.
  И, в конечном итоге, формирования "самосогласованной" структуры
  СИСТЕМЫ различных смыслов отдельных эмбеддингв.
  
  Формулировка, конечно, "кореватая", но пока такая,
  важно зафиксировать мысль, чо процесс обучения эмбеддигам нейронки,
  как-то существенно отличается от человеческого обучения новым терминам
  и их контекстному использованию.
  И, в то же время, некоторой аналогии этих процессов.
  
  Вот этим и стоит заняться, наверно, в приоритетном порядке.
  
  
  ===========
  
  09.03.2024 14:03
  
  Реальные перспективы промпт-инжениринга.
  В оглавление.
  
  Коротенькая заметочка о том, как быстро все меняется в сфере ИИ-систем:
  
  "Исследователи: профессия промпт-инженера умерла, не успев появиться".
  Автор: daniilshat (Даниил Шатухин)
  https://habr.com/ru/news/798807/
  7 мар 2024 в 19:17
  
  //// Начало цитирования.
  
  Исследователи уверены,
  https://spectrum.ieee.org/prompt-engineering-is-dead
  что профессия промпт-инженера не получит большого внимания
  и не станет востребованной.
  Всё дело в том, что языковые модели составляют запросы для генерации контента
  лучше и точнее, чем люди.
  Поэтому промпт-инженером может стать специально обученная нейросеть.
  
  Рик Баттл и Тедж Голлапуди, работающие в компании VMware,
  рассказали, что языковые модели часто непредсказуемо реагируют на запросы.
  К примеру, очень подробный и детальный запрос
  может не дать качественного результата,
  но неочевидные подсказки заметно улучшают ситуацию.
  К примеру, если попросить языковую модель пошагово объяснять своё рассуждение,
  то она лучше решает математические и логические задачи.
  
  Исследователи заметили, что даже просьба пошагово объяснить действия
  не всегда оказывается полезной.
  На качество ответа влияет сам вопрос,
  набор входных данных и другие параметры.
  Разные комбинации дают разный результат.
  Отмечается, что языковые модели понимают письменную речь
  и отвечают на вопросы текстом,
  из-за этого люди антропоморфизируют нейросети.
  Всё это ведёт к тому, что человек пытается объяснить запрос так,
  как он передал бы задачу другому человеку.
  
  Такой подход плохо работает.
  К примеру, Рик Баттл рассказала
  про способ составления промптов с помощью самой языковой модели.
  Большинство таких запросов получаются нелогичными для человека,
  но дают лучший результат, чем метод подбора с помощью проб и ошибок.
  В одном из случаев запрос, составленный нейросетью,
  начинался с отсылки на <Звёздный путь>,
  и это заметно улучшило сгенерированный ответ.
  
  Баттл утверждают, что нейросети представляют собой
  набор математических моделей и алгоритмов,
  а люди не могут точно знать как они работают,
  и какие из команд оказывают на нейросеть большее влияние.
  Поэтому даже пользователи, называющие себя экспертами в промптинге,
  просто находят удачные комбинации,
  но не могут составлять сразу хорошие запросы.
  
  В качестве ещё одного примера целесообразности использования нейросеть
  для генерации промптов приводят недавний эксперимент команды Intel.
  Инженеры компании разработали инструмент для Stable Diffusion,
  который получает пользовательский запрос,
  а потом преобразует его в оптимальный для нейросети.
  В результате изображения, сгенерированные с помощью преобразованных промптов,
  получается более детализированными и эстетичными.
  Для преобразования запросов разработчики Intel
  обучили специальную нейросеть.
  
  Рис Изображение, созданное по запросу человека (слева)
  и по преобразованному запросу (справа)
  
  Исследователи считают, что профессия промпт-инженера
  уже утратила свою актуальность,
  не успев стать востребованной и популярной.
  Нынешние языковые модели могут генерировать более правильные
  и эффективные запросы
  чем люди.
  
  ........
  
  //// И десять страниц комментариев на самые разные аспекты этого сообщения,
  //// местами очень интересные и познавательные. Вот парочка из них.
  
  inkelyad
  4 часа назад
  
  Тут проблема в том, что оно не 'умение выражать свои мысли'.
  А знание того, что если (условно) добавить 'напиши красивый вкусный текст о...'
  в запрос-заклинание - то результат получается лучше.
  
  А почему получается и можно ли как-нибудь список таких магических слов
  рациональным способом получить?
  А кто бы знал.
  Из опыта следует что магический артефакт лучше работает,
  если эти слова туда добавлять.
  Поэтому составляем списки-гримуары хорошо работающих заклинаний.
  Причем, вообще говоря, совсем не гарантируется,
  что в конкретном случае они тоже сработают хорошо
  или не перестанут работать в будущем.
  
  .......
  
  panzerfaust
  10 часов назад
  
  Сиди на берегу реки и жди, пока мимо тебя не проплывет
  очередная "профессия будущего". c
  
  ........
  
  //// Конец цитирования.
  
  Безотносительно перспектив профессии "промт-инжениринга",
  хочется все-таки отметить очень важный и практичный момент
  из этой коротенькой заметки.
  Это возможность привлекать ИИ-систему к работе с другой системой,
  причем не обязательно тоже ИИ-системой.
  
  Тут два важных момента: первый, наиболее очевидный, в том,
  что действительно ИИ-системы имеют доступ куда более широкой базе данных/знаний,
  и это позволяет использовать их как очень интеллектуальные справочники,
  иногда сравнимые по уровню со специализированными экспертными системами.
  В качестве примера могу привести собственный опыт
  попыток найти какие-то подходы к "Моделью Kandinsky 2.1",
  когда за несколько вечеров я сумел найти только одну "животворящую точку".
  И получение достаточно полныго набора инструкций к этой системе от Bing, см.:
  "Рекомендации ИИ-системы Bing по работе с "Моделью Kandinsky 2.1".
  И это при том, что в открытом доступе такой информации
  до сих пор как не было, так и нет.
  
  А второй, менее очевидный, но еще более практичный в том,
  что формулируя запрос к одной ИИ-системе,
  используя подсказки/наводки, полученные из другой ИИ-системы,
  начинаешь лучше понимать собственно и задачу и метод ее решения.
  
  И это на самом деле покруче, чем банальный "промпт-инжениринг",
  основанный на использовании "магических/шаманских формулировок".
  
  
  ===========
  
  14.03.2024 20:25
  
  О нео6ходимости промпт-грамотности замолвите слово.
  В оглавление.
  
  Если по поводу перспектив промпт-инжениринга, как особой специальности,
  где-то граничащей с магией, споры только начинают разгораться,
  то относительно минимальной "промпт-грамотности",
  т.е. умения и понимания, какими возможностями генеративных систем
  уже сейчас можно достаточно эффективно пользоваться,
  сомнения, наверно, уже остались в прошлом.
  Нужно объявить "решительный бой" "промпт-безграмотности",
  и этот материал, на мой взгляд, в этом отношении весьма неплох:
  
  "Исследование пользовательского опыта с ChatGPT:
  мои лайфхаки, ошибки и выводы".
  Автор: Salver (Миша)
  https://habr.com/ru/companies/lamoda/articles/799771/
  14 мар 2024 в 13:02
  
  /// Начало цитирования.
  
  ........
  
  Поэтому мне было любопытно, получится ли встроить в нашу работу AI,
  не потеряв ее ценность и смысл:
  например, подключить ChatGPT на этапе анализа интервью и синтеза результатов.
  
  ........
  
  С ChatGPT нужно общаться, чтобы получить результат
  //// Вот это, наверно, "квинтэссенция" всей "промпт-грамотности".
  //// Не нужно ждать готового 100% ответа на любой свой запрос,
  //// а исходить из того, что к нему можно приблизиться
  //// в процессе осмысленного и планомерного диалога.
  
  Перед началом исследования мне нужно было выбрать респондентов для интервью.
  Решить, сколько человек приглашать,
  сколько из них должны быть клиентами Lamoda,
  на какие категории и по каким признакам разбивать людей и так далее.
  
  Критерии для выбора я доверил ChatGPT.
  Первый промпт составил по всем канонам промпт-инжиниринга:
  
  Задал роль, чтобы бот действовал в рамках определенной области знаний
  - исследований.
  
  Добавил контекст: сказал, что он проводит исследование по такой-то теме,
  прояснил цели бизнеса и цель исследования.
  
  Сформулировал задачу, используя глагол действия
  (действуй, определи, проанализируй).
  И четко формулировал конечную цель.
  
  Показал пример.
  Так бот лучше понимает, чего от него ждут.
  
  Объяснил формат ответа: как должен выглядеть результат.
  Если формат не указать, бот скопирует формат из примера.
  
  Рис. Мой первый промпт (информацию под многоточием я сократил для статьи)
  
  Я сделал все по рекомендациям.
  Но ChatGPT ответил очень поверхностно, а потом и вовсе отказался работать,
  так как информации было слишком много.
  
  После нескольких неудачных попыток я изменил подход.
  Решил действовать поэтапно и не закидывать все в одно сообщение:
  
  Сократил количество контекста.
  Вначале загрузил только исследовательские вопросы и попросил их запомнить.
  
  Затем загрузил и попросил запомнить оставшуюся информацию по задаче.
  
  После этого попросил сформулировать требования к респондентам.
  
  В этот раз ChatGPT ответил. Но ответ был неполным:
  например, он не указал точное количество человек для интервью,
  не назвал магазины, которыми они должны пользоваться.
  
  Я не сдавался и пытался вместе с ботом докопаться до истины,
  задавая уточняющие вопросы.
  
  .......
  
  В итоге получил вполне приемлемый список критериев.
  И сделал первые важные выводы о работе GPT:
  
  Не жди, что с первого же запроса получишь правильный ответ.
  С ботом нужно вести разговор, чтобы добиться результата.
  Совсем как с человеком:
  
  задавать уточняющие вопросы,
  
  спрашивать мнение,
  
  сомневаться в ответах.
  
  Если материалов много, знакомь ChatGPT с ними поэтапно.
  
  Если результат не устраивает, задавай уточняющие вопросы
  и делись с ботом своими сомнениями.
  
  Проверяй работу - или пусть это делает сам ChatGPT
  
  Работу важно проверять.
  Поэтому следующей задачей для ChatGPT стала проверка качества критериев.
  
  Я попросил бот запомнить получившийся список.
  А после загрузил критерии, которые использовали мои коллеги
  из команды Custom Research для количественного исследования по этой же теме.
  Попросил сравнить две выборки и сказать, какая из них лучше.
  
  Выборку моих коллег он оценил более высоко - на 5, а свою на четверку.
  Я попросил объяснить, почему так.
  Бот подробно рассказал, в чем плюсы выборки от коллег
  и в чем недостатки его собственной работы.
  
  Тогда я попросил его доработать выборку.
  И он это сделал:
  конечно, без странностей не обошлось,
  и мы с ними немного поспорили.
  //// По своему опыту могу сказать, что такие споры,
  //// хотя и весьма затратные и по времени, и по усилиям,
  //// иногда оказываются самыми результативными во всем диалоге.
  //// Причина в том, что пытаясь переубедить "тупую железяку",
  //// как вполне адекватного вдумчивого и немного "консервативного" собеседника,
  //// намного лучше понимаешь/формулируешь собственную позицию/аргументы,
  //// а иногда находишь в этом споре такие "повороты сюжета",
  //// о которых даже не задумывался ранее.
  Но когда я обсудил результат с продактом, коллегами из коммерции
  и команды Custom Research, у них не было вопросов:
  все было отлично.
  
  В результате я понял несколько вещей:
  
  Обязательно проси ChatGPT оценить свою работу.
  Есть несколько вариантов, как это сделать.
  Я использовал такие:
  
  находил более качественный пример и просил сравнить два результата;
  
  давал ему роль преподавателя или эксперта в нужной теме
  и просил поставить оценку работе.
  
  Если бот ставит невысокую оценку, проси исправить работу и сделать ее лучше.
  Он хорошо с этим справляется.
  
  Действуй поэтапно
  
  ..........
  
  Какие выводы я сделал:
  
  С GPT работает эффект стажера:
  он очень хочет ответить и не разочаровать тебя.
  //// Что есть, то есть.
  //// Обычно ИИ-ассистент действительно очень старается доказать свою полезность,
  //// но нужно всегда быть готовым, что иногда он бывает "не в настроении",
  //// но в отличии от живого собеседника,
  //// вывести чат-бота из этого состояния вполне возможно, хотя и требует усилий.
  Поэтому когда он не может найти нужную информацию,
  он начинает ее придумывать.
  Действовать здесь тоже нужно как со стажером:
  не ругать за ошибки, а уточнять,
  почему он выбрал такой ответ.
  Он проверяет себя и признает, что был неправ.
  
  Устанавливай свои правила в процессе общения.
  Когда ChatGPT выдумывал ответы, я обращал его внимание на это.
  Например, просил в следующий раз, когда он не найдет информацию,
  отвечать честно, что информации нет.
  Это работает.
  
  Следи за тем, чтобы ответы GPT были понятны не только тебе.
  Показывай результаты коллегам или просто другим людям,
  чтобы это проверить.
  Если результат непонятен, возможно, проблема не только в формулировке:
  также влияет неудачная постановка задачи, неудачный пример или шаблон работы.
  
  Результат
  
  Финальный список состоял из 65 функциональных и 50 эмоциональных работ,
  многие из которых были близки по смыслу.
   С моей помощью бот объединил их в 4 функциональные и 4 эмоциональные работы.
  
  По тому же принципу я проанализировал расшифровки интервью,
  чтобы найти ответы на исследовательские вопросы
  и подтвердить или опровергнуть гипотезы о продукте.
  Результаты добавил в свой отчет и представил его команде.
  
  Какие выводы я сделал?
  
  Хочу интегрировать ChatGPT4 в исследования как рутину.
  Бот может стать полноценным инструментом анализа глубинных интервью.
  На момент исследования (октябрь 2023 года)
  еще не было возможности использовать ChatGPT4 в UX-исследованиях,
  но с тех пор технология сделала несколько шагов вперед,
  и я хочу попробовать и этот вариант.
  
  Правильные отношения с ChatGPT4
  - не ждать сразу готового результата, а настраиваться на диалог.
  Поиск решения строится как беседа:
  <А что если делать вот так?>,
  <А если мы вот это попробуем?>,
  <Как ты думаешь, ты прав или нет?>.
  В ходе такого разговора GPT приходит к хорошим результатам.
  
  ChatGPT повышает твою ценность на рынке,
  потому что ты становишься более эффективным специалистом.
  Сроки работы над исследованием с ботом у меня сильно сократились.
  Анализ шел 1,5 дня вместо обычных 6-7.
  Написание дизайн-сценария заняло около 2-3 часов,
  хотя обычно я трачу целый день.
  У меня как будто появился личный, очень талантливый и смышленый помощник.
  Сейчас я не ограничиваюсь ChatGPT,
  использую Сlaude AI и Gemini (работаю с ними в Poe.com).
  
  Интересно экспериментировать и решать задачи по-разному.
  Например, пробовать задавать разные роли для бота.
  Я просил его действовать в роли ведущего исследователя
  из компании Usability Lab,
  в роли Дона Нормана - человека, который популяризовал термин User Experience.
  С Доном Норманом, кстати, получилось очень плохо.
  Возможно, на английском сработало бы лучше.
  
  ChatGPT действительно очень хочет тебе помочь.
  Это подкупает и усыпляет бдительность.
  Помните эффект IKEA?
  Когда делаешь что-то своими руками,
  то намного трепетнее к этому относишься.
  Я попал в эту ловушку: восхищался способностями GPT
  и не подвергал результат серьезному критическому анализу.
  Важно проверять работу и обязательно показывать результаты кому-нибудь еще.
  
  ......
  
  //// Конец цитирования.
  
  Даже не хочется ничего дополнительно добавлять к этому материалу,
  кроме разве того, что для каждой ИИ-системы требуется
  свой индивидуальный подход.
  И выработать его можно только в процессе общения с ней и,
  самое главное, пытаясь совместно с ней решить настоящую практическую задачу,
  которая Вам не безразлична.
  Только в таком случае можно почувствовать всю необходимость и прелесть
  настоящей "промт-граммотности", основанной не на "магических заклинаниях",
  а на живом, человеческом общении с по-настоящему загадочным и
  в чем-то не почеловечески разумным ИИ-ассистентом.
  
  
  ===========
  
  Бригантина
  
  Бригантина Звездочка-Точка-Звездочка. Модель Kandinsky 3.0 нарисовала:  dc834612f23f46a5adad8c348c576eb4_res_00000_image
  
  Бригантина Звездочка-Точка-Звездочка. Модель Kandinsky 3.0 нарисовала:  6c331a8d23334e6595f4a4b854dfda6f_res_00000_image
  Flag Counter
  Free counters!
  
 Ваша оценка:

Связаться с программистом сайта.

Новые книги авторов СИ, вышедшие из печати:
О.Болдырева "Крадуш. Чужие души" М.Николаев "Вторжение на Землю"

Как попасть в этoт список

Кожевенное мастерство | Сайт "Художники" | Доска об'явлений "Книги"