Поднял Clip Interrogator Сaptioner
Jun. 29th, 2025 11:14 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Спросил Chat-Gpt где взять стендалон прогу которая бы расшифровывала картинки, процесс в какой то степени обратный генерации (естественно тоже требующий ИИ-модель), в automatic1111 функция встроенная, но из-за меньшей оптимизации он более медленный хоть и с более широким функционалом (и я его до сих пор не соберусь поставить), но у меня быстрый (ну относительно) и почти голый по функционалу Forge (ну лоры только), который трогать практически нельзя, несмотря на то что webui интерфейсы automatic1111 и Forge одинаковые. В общем не знаю зачем мне понадобилось, потому что эта функция встроена также и в Fooocus (просто я им не пользуюсь, не нравится он мне, я его даже собираюсь прибить, но пока не) Поэтому все-таки поднял отдельно стендалон-интеррогатор с webui интерфейсом gradio, Chat-GPT сначала спросил мол у тебя conda есть, а у меня старая анаконда (консоль языка Питон на котором работает весь ИИ) ещё когда я с самого начала экспериментов с ИИ Pinokio (ЧСХ принципиально не работающий на AMD, но я тогда ещё не знал этих приколов) пытался поставить, он пошутил над тем что мол артефактный путь к несуществующему pinokio (а менять путь и переустанавливать анаконду не хочу, а вдруг что затронет), в общем поставил а потом ещё раз 5-10 я ему "у меня тут ошибка", а он "это ничего, это нормально, просто исправь на (танцы с бубном)". Зато теперь есть стендалон прога (ставится с huggingface)
Удобно как раз тем, что ничему не мешает.
Вот так минималистично выглядит

Это я к чему без чат-Gpt фиг бы я поставил или попробовал бы и быстро бросил....
Аналог есть на huggingface https://huggingface.co/spaces/pharmapsychotic/CLIP-Interrogator но у него есть недостаток😂 он ошибку выдаёт (это всё из-за проблем совместимости меняющихся со временем версий библиотек и проч компонентов) Почему собсно так долго танцевал с бубном с Чат GPT, но именно теперь понятно какая от него может быть польза в этом плане: как минимум как от примитивного компилятора для чайников в программировании... Ну а я чайник окромя бейсика в детстве ничего даже и не пробовал, точнее в институте на информатике один нерд нам даже С++ пытался задвигать, но это гиблое дело было. Ну и в html некоторые комманды знаю и очень смутно представляю архитектуру и на этом всё.
Чае GPT сам прекрасно анализирует картинкии и даже лучше чем кто бы то ни было, но у него на это жёсткий суточный лимит, как на генерацию так и на вообще общение в ветке где присутствуют картинки. Тут он как и все они денюжку хочет...
Удобно как раз тем, что ничему не мешает.
Вот так минималистично выглядит

Это я к чему без чат-Gpt фиг бы я поставил или попробовал бы и быстро бросил....
Аналог есть на huggingface https://huggingface.co/spaces/pharmapsychotic/CLIP-Interrogator но у него есть недостаток😂 он ошибку выдаёт (это всё из-за проблем совместимости меняющихся со временем версий библиотек и проч компонентов) Почему собсно так долго танцевал с бубном с Чат GPT, но именно теперь понятно какая от него может быть польза в этом плане: как минимум как от примитивного компилятора для чайников в программировании... Ну а я чайник окромя бейсика в детстве ничего даже и не пробовал, точнее в институте на информатике один нерд нам даже С++ пытался задвигать, но это гиблое дело было. Ну и в html некоторые комманды знаю и очень смутно представляю архитектуру и на этом всё.
Чае GPT сам прекрасно анализирует картинкии и даже лучше чем кто бы то ни было, но у него на это жёсткий суточный лимит, как на генерацию так и на вообще общение в ветке где присутствуют картинки. Тут он как и все они денюжку хочет...