Поточний час: 28 бер 2024, 20:50

Часовий пояс: UTC + 2 години



Почати нову тему Відповісти на тему  [ Повідомлень: 5 ] 
Автор Повідомлення
#135107Повідомлення 28 лист 2023, 23:57 
Власник електровелосипеда, член клубу
Аватара користувача
Не в мережі

Звідки: Запорожье
Дякував (ла) 285 Подякували 1001
Мій електротранспорт: >
Епілог... (лірика, та про моє залізо)
Якось я пропускав тему локальних нейромереж, мені здавалося що для цього потрібні суперобчислювальні ресурси, або як мінімум крута відеокарта, (який у мене немає, не було, і походу в найближче майбутнє не привидиться). Але на тлі тотальних відключень мною був куплений маложручий кишеньковий мінікомп'ютер (розмірами 8х8см) з шестиватним інтелівським процесором N100 - 23року випічки, де відеокарта вбудована вже в процесор, і на борту 16 гіг оперативи (що б це все з монітором легко і довго тягнула батарея електровела ). Тому ж мій великий системник морально застарів, він пожираючи в 10-30 разів більше електрики був в два рази повільніше за цю кишенькову іграшку з аліекспресу ціною 130уе.
Довгий шлях... (читайте - не читайте, але саме тут посилання на нейросітки для інсталяцій)
І тут трапляється мені в черговий раз статейка про нейросітку stable-diffusion, яка генерує картинки по текстовому запиту. Цього разу я чомусь не став це ігнорувати. І виявилося, що на 16 гігах оперативи можна запустити. Треба думаю пробувати, а то тут на голову може у будь-який час прилетіти, а я ще нейросітками не бавився... Коротше взяв найвідоміший реліз від А1111 з гітхабу https://github.com/AUTOMATIC1111/stable-diffusion-webui , але воно у мене запрацювало тільки на ядрах процесора, а це 20 секунд на ітерацію, а ітерацій для однієї картинки потрібно десь від 20 штук + накладні, сумні 7+ хвилин на картинку 512х512... (картинка 786х786 генерується ще в 4 рази довше) , А для більшого дозволу вже 16 гіг мало (все падає). Після поглибленого вивчення матчасті було знайдено посилання на форк з технологією (паралельний проект) https://github.com/openvinotoolkit/stable-diffusion-webui який має навантажити інтелівське відеоядро. Воно запрацювало але через анус (працювала лише проста генерація), а з моделями, які працюють з масками, падало. Приріст продуктивності при задіянні відеоядер був чотириразовий (5-6 секунд на ітерацію). Але оскільки робота з масками найсмачніша з технології, активний пошук привів до ще одного проекту https://github.com/vladmandic/automatic , який виявився на голову вище (професійніше зібраний). Якщо робити за інструкцією(у якій фактично три простих кроки), то воно запрацює , я з першого разу звичайно накосячив бо перемудрив, а потім уже почав читати інструкцію з встановлення. За підсумками все запрацювало (і навіть такі фішки про які я навіть мріяти не міг), так що рекомендую його, повинен працювати на всьому, хоча на нормальних відеокартах (не інтел) і перші два попруть, але вони по наворотах як велосипеди проти мерседеса .
Суть...
Отримувати картинку з тексту в принципі цікаво, але малопрактично. А ось домальовувати те чого немає, прибирати те, що є (домальовуючи на місці прибраного те, що там може бути) зовсім інша історія. Нейросітка фактично перетворюється на інтелектуальний фоторедактор з художником на додачу, котрим ми можемо понукати як хочемо (як у фільмі Бумбараш: -Намалюй мені там Кунгуру). Нижче можна побачити приклад моїх знущань на фоткою дівчини (попередньо завантаженою з инета). Спочатку я спробував прибрати окуляри, англійською це звучить як скло, тому замість сонцезахисних я отримав інші окуляри (без стекол), коли я уточнив що окуляри треба прибрати з обличчя, я отримав шукане (окуляри прибрані, очі домальовані, причому дуже не погано) . Далі я попросив замінити колір купальника на білий, але вийшов тільки з білою окантовкою, я перефразував що замінити купальник із суцільною білою заливкою, та отримав повністю білий. Тож треба бути гранично точним у своїх запитах, бо залізяка не людина - розуміє буквально. Потім я заради інтересу попросив десяток варіантів із випадковими купальниками, і результат був цілком придатним, практично без браку. Ну і на кінець я виділив маскою все що нижче голови, і попросив намалювати дівчину на електровелосипеді (щоб прив'язатися до теми форуму) різними стилями, можете побачити результат, всі знущання на дівчиною запхано в 2 слайдшоу (гіфки).
Додаткові файли:
001.gif
001.gif [ 1.06 МБ | Переглядів: 670 ]
Додаткові файли:
002.gif
002.gif [ 954.51 КБ | Переглядів: 670 ]


Плюшки...
Цей останній форк просто зачарував функціоналом. Чого варте лише наявність стилів із величезного списку (не треба самому в тексті запиту винаходити), їх можна комбінувати. А шедулер (черга завдань) це взагалі бомба, можна не чекати кінця генерації, а змінювати запити та параметри і ставити наступну генерацію в чергу, а потім вона з черги все виконує. Плюс не треба самому нишпорити в пошуках на двох найвідоміших хостингах моделей, в інтерфейсі зручний пошук по цих хостингах вже вбудований (само закачає і поставить як слід, без кривих рук користувача).

В цей розділ тема попала бо з прямими руками нейросітку можна використовувати для дизайну та підготовки фото матеріалів (люди навіть для відео кліпів застосовують).
Бажаю успіху тим хто захоче спробувати.

_________________
2 моноколеса, 2 электровела, 2 подводных буксира, надувной электро-каяк.


Повернутися до початку
 Профіль  
Відповісти цитуючи  
#135109Повідомлення 29 лист 2023, 07:45 
Активіст форуму
Аватара користувача
Не в мережі

Звідки: Тернопіль
Дякував (ла) 0 Подякували 30
А голову повертати сінхронно з тулубом можна?

_________________
Навіщо займатися електрикою якщо не в змозі опанувати навіть мову.
https://www.youtube.com/watch?v=M8JfGYuut0w


Повернутися до початку
 Профіль  
Відповісти цитуючи  
#135110Повідомлення 29 лист 2023, 08:49 
Власник електровелосипеда, член клубу
Аватара користувача
Не в мережі

Звідки: Запорожье
Дякував (ла) 285 Подякували 1001
Мій електротранспорт: >
Щоб вона повертала голову, вона повинна при навчанні мати фотку тієї голови у профіль.

Наприклад як що я введу в запит Том Круз на велосипеді, то на тулобі буде його обличчя під різними кутами, бо базова модель навчалася на мільярді+ фотографій, серед яких було кілька десятків Тома Круза під різними кутами. Але є можливість донавчити базову модель, треба взяти купу портретних фотографій конкретної людини, і провести донавчання моделі (є описи як то робити, на гарній відеокарті буде мабудь пару днів маслать, а на моїй можна і більше місяця чекати), потім ви вводите им'я яке асоціювали з навчальними потретами, і модель вже буде липити лице цієї людини по текстовому запиту навіть без режиму маски.

_________________
2 моноколеса, 2 электровела, 2 подводных буксира, надувной электро-каяк.


Повернутися до початку
 Профіль  
Відповісти цитуючи  
#135115Повідомлення 29 лист 2023, 11:49 
Активіст форуму
Аватара користувача
Не в мережі

Звідки: Тернопіль
Дякував (ла) 0 Подякували 30
Ятак розумію що фото дівчини було взяте з інтернету. Якщо так, то можемо припустити що вона модель чи наприклад якийсь блогер з тік току. Розсудимо далі. Якщо вона модель чи блогер то у неї повинно бути повно фото у різних ракурсах голови та тіла. Тобто там є і фото ії голови під різними кутвми та розворотами. То чому тоді цей штучний інтелект на найде усі ці ії фото та не приліпить ії голову у нормальому стані до тулуба? Це ж його справа це робити в не моя. Моя справа тільки підсунути йому якесь фото і накахати що зробити. Чи цей інтеллект не такий вже інтелект що йому треба на кожному році пілсказувати та штовхати. Щось декілька він тупуватий. Це вже й і не інтелект якщо сам не може нічого розуміти. Це просто швейцар на вході у ресторан чи якийсь просто слуга недотепа))). Нема щось у нього ніякої ініціатіви.

_________________
Навіщо займатися електрикою якщо не в змозі опанувати навіть мову.
https://www.youtube.com/watch?v=M8JfGYuut0w


Повернутися до початку
 Профіль  
Відповісти цитуючи  
#135122Повідомлення 29 лист 2023, 15:40 
Власник електровелосипеда, член клубу
Аватара користувача
Не в мережі

Звідки: Запорожье
Дякував (ла) 285 Подякували 1001
Мій електротранспорт: >
Цитата:
чому тоді цей штучний інтелект на найде усі ці ії фото та не
тому що
Цитата:
За розрахунками нейрофізіологів, людський мозок здатний запам'ятати від 5 до 20 петабайт інформації
Шо десь у 10 мільйонів разів більше чим розмір цієї нейросітки яка в мене працює на компі за 130 баксів, надіюся далі пояснювати не треба. От як буде у вас як є у гугла, амазона, ілона маска ... десятки тисяч прискорювачів типу H100 по 50 тисяч баксів кожен, тоді і будете вашому штучному інтелекту пред'являти завищені вимоги.

_________________
2 моноколеса, 2 электровела, 2 подводных буксира, надувной электро-каяк.


Повернутися до початку
 Профіль  
Відповісти цитуючи  
Показати повідомлення за:  Поле сортування  
Почати нову тему Відповісти на тему  [ Повідомлень: 5 ]             

Часовий пояс: UTC + 2 години


Хто зараз на конференції

Зараз цей форум переглядають: немає зареєстрованих користувачів і гості: 1


Ви не можете створювати нові теми
Ви не можете відповідати на повідомлення
Ви не можете редагувати свої повідомлення
Ви не можете видаляти свої повідомлення
Ви не можете додавати додаткові файли

Найти:
Створено на основі phpBB® Forum Software © phpBB Group