Questions about AI / Вопросы по AI

in Steem Alliancelast year

Проверка текстов постов на использование технологии AI является одной из задач, поставленных для команд кураторов СКхх в этом месяце. Решая эту задачу я столкнулся с ситуацией, которая мне до сих пор не понятна. Хотелось бы получить мнения других пользователей по вопросу, который я подниму ниже.

Обычно я пишу тексты своих постов на двух языках: английском и русском (носителем которого я являюсь. Для получения английского варианта текста я пользуюсь Яндекс-переводчиком. Поскольку автоматический перевод может быть не до конца корректным, я оставляю оригинал на своём языке для возможных уточнений, если кто-то что-то не донца поймёт. Возможно другие программы перевода сделают это иначе.

Этот пост я пишу чисто на русском языке, что бы вы могли работать с оригиналом.

Почему я так подробно это объясняю?

10 апреля был мой день курации (СК08) и я как обычно искал посты, которые заслуживают поддержки. В числе прочих мне попался пост, написанный на бенгальском языке. Мне понравилась фотография из превью, текст, который был написан не латиницей и я открыл этот пост. До этого момента я почти не встречался с бенгальским языком.

Проверяя пост на оригинальность (стандартная проверка) я скопировал текст и отправил его на сайт проверки AI.

В своей работе я использую несколько сервисов для проверки AI:
https://openai-openai-detector.hf.space/
https://www.zerogpt.com/
https://app.gptzero.me/app/welcome

К своему разочарованию я получил положительный тест на AI...
В комментариях к посту я задал простой вопрос:

image.png
What can you say about the results of the audit? / Что вы можете сказать о результатах проверки?

Не ожидая ответа я открыл второй пост в этом сообществе (Incredible India) на бенгальском языке и тоже сделал стандартную проверку. Результат оказался точно таким же.

Я начал сомневаться в возможностях сервисов. Известно, что они могут ошибаться. Тогда я обратился к постам модераторов этого сообщества. По моему предположению их посты должны быть на 100% "написаны человеком".

Я проверил этот пост https://steemit.com/hive-120823/@sampabiswas/5ybaqd
... и ещё один: https://steemit.com/hive-120823/@piya3/5xhraw

И опять все три сайта оценивают текст как написанный с помощью AI...
Но это же пост модератора, опытного и уважаемого человека.
Я оставляю им тот же комментарий со сканами результатов тестов и таким же вопросом: что вы можете сказать...?

К сожалению, модераторы не дали ответов по существу. Они сослались на результаты своей проверки другим сервисом: https://contentatscale.ai/ai-content-detector/
Я послал текст на указанный сервис, но сервис отказался обрабатывать мой запрос.

Что-то пошло не так, пожалуйста, попробуйте еще раз.

Я пробовал несколько раз, но так и не смог получить результата.

Хотя нет, один результат всё-таки был :)
Меня обвинили в клевете на честных и заслуженных людей и намекнули на отсутствие интеллекта... Не знаю, как вопрос по существу может быть клеветой...

I was also charged by the same person while going through the phishing attack, those people who are working several platforms, only dependent on AI ;
but we must also include our intelligence while performing any responsibility. Lol!

Видимо сам факт проверки создал такую эмоциональную реакцию.
Однако ответов по-существу я так и не получил и все мои вопросы повисли в пустоте вакуума.


Но эта история имела своё развитие. Продолжая курировать я зашёл в другое сообщество и тоже увидел знакомый бенгальский язык. Было бы странным, если бы я прошёл мимо этих постов. Вот один из них:
https://steemit.com/hive-179660/@ahlawat/better-life-with-steem-the-diary-game-is-927th-entry-on-9th-april-2023

Дальше я привожу скрины трёх сервисов с результатами проверки текста на бенгальском языке.

image.png

image.png

image.png

Как минимум второй сервис проголосовал за человека. Раньше такие результаты не получались.
На всякий случай проверяю ещё один пост и опять чуть-чуть радуюсь:

image.png

Оба поста содержали оригинальные авторские фотографии и были поддержаны СК08.


Но мои вопросы по-прежнему висят в воздухе.

Я не смог ответить как минимум на следующие:

  • Существует ли надёжный сервис для проверки текстов на бенгальском языке...
  • Насколько проверенные мной тексты написаны человеком "из головы" и насколько с помощью AI...
  • Какой процент содержания текста AI следует считать порочным...

Если кто-то знает ответы на эти вопросы, прошу поделиться в комментариях.
Это важно для корректного курирования.

Приглашаю к беседе так же :
@sampabiswas
@piya3

Sort:  

I translated your posts and read through.
This is a very tricky situation @bambuka. You are doing your job honestly and there is no doubt about this, but the fact is that these tools are creating a lot of confusion. I saw on @gungho's post where my name was mentioned under 15% AI positive content, whereas the fact is that all my content is 100% genuinely written by me unless I am writing about history of some place and I need dates for that. It is possible that some words will match here and there for some posts and that will happen with almost every posts because some words commonality will be there. We are not inventing any new language while writing our posts, we are using the known common languages and every subject we write about is also out there on google and all other medias, we give our own view points to that, which some time will match with something that is already mentioned somewhere.
Anyways, I think we need to collectively find out solutions to this matter and come up with tools which can be relied upon and agreed by respective communities of regional languages.
When we read a post we can make out if this content is copied or original. Original content will have some personal references as well.
It is again a fact that some people will take advantage of this confusion and hence this work cannot be stopped, but need to be managed sensitively.

Anyways, I think we need to collectively find out solutions to this matter and come up with tools which can be relied upon and agreed by respective communities of regional languages.

With this statement/sentence, you expressed my desire. But I have a feeling... I don't even know how to say... :)

As soon as a text is automatically translated (and that's (unfortunately) most texts presented to us in English here, especially of course if it's written with "foreign" characters, so for me also Russian), the review shows AI-generated to a large extent. Sent several times through the translator (ex. Bengali to English (already from the author) to Spanish (from Venezuelan community admin) to Russian (from sc08)), the AI portion becomes higher and higher.
Why? Because the automatic translators are also AI that simply have phrases they repeat over and over stored as records.
You must not rely on these checkers! At least not if you don't know the checked language yourself.
In German, I recognize an AI-generated text pretty quickly even without a test program. English is more difficult (although I speak English quite well), other languages impossible!

Translated with www.DeepL.com/Translator (free version)

I agree with you. I also feel the text in Russian, and when common bland faceless phrases come across, it is alarming and raises doubts about authorship.

But checking texts for AI is one of the mandatory conditions for curation. As a curator, I am obliged to do this and I do it (especially when a post on some topic that goes beyond the personal experience of the user and even with pictures from the network).

I specifically wrote this post to draw the attention of the community to this aspect of posting. Apparently it's time to change the rules of curation and abolish the AI check.

At the same time, the check for plagiarism should remain. Here search engines cope correctly. They provide a link to the original source.

Here are the results of checking my comment, which I translated into English by Yandex translator.

image.png

Haha, I've always been particularly suspicious (not just in my three-month sc attempt) when a post from users I didn't know seemed "way too" good. In this case mostly it was a plagiarism (or a foreign text with transformed sentences).
I still prefer to rely on my intuition than on technology. And every sc curator should do the same instead of blindly following "instructions". There have been some very, very ridiculous incidents in this regard. E.g. a user was warned because 7% (!!!) of his post was supposedly AI-generated.
I can only speak for myself and do not know how other users are. For me, such behavior has the bitter taste of blind obedience - and thus falls (bitterly) back on various sc-curators. Such an adaptation (that is now kindly expressed, because I do not want to make myself completely unpopular) to "big curators" I never liked. Never - that is, just as well in times when there was no Steemit Team and its curating staff.

Edit
Sorry, I have to edit some minutes later, because I realize that I am moved by the subject matter. It makes me sad. Or angry. I do not know it myself so exactly. So:
Honestly, I believe that the Steemit Team around @steemcurator01 also sees the handling of problems (be it AI, be it plagiarism) the same way as I have presented it. Because they need employees who are able to think for themselves - no hangers-on who always say "yes and amen" (just to don't put their own advantages in danger...).

It's rather not a question of "blind obedience" :)
I love the transparency of the rules of the game.
If any rule of the game exists, it must be executed by all players. It's like a standard.
But we all know from life that there are double standards, "sacred cows" that cannot be touched.
If the implementation of a rule is impossible, then it must either be corrected or eliminated altogether.

Again, if I rely on my intuition and assume that the text is generated by AI... and what's next? This is my assumption and now I have to confirm it. The question is... what? And again we return to the verification services ... which we don't trust...

I am in favor of eliminating this rule on the basis that its observance is incorrect. But this is only my private opinion and the decision of those who create the rules of this game is necessary. While there is no such decision, I have to either play by the rules or stop playing at all.

"Playing" in a team means to me, in case of doubt (and that's the only thing it can be about when using AI checkers) to exchange with other team members and together make a decision.
Using the technology is okay. But this should only be a clue, not a decision maker.

I agree, the decision is made by a person)

Edit
Sorry, I have to edit some minutes later, because I realize that I am moved by the subject matter. It makes me sad. Or angry. I do not know it myself so exactly. So:
Honestly, I believe that the Steemit Team around @steemcurator01 also sees the handling of problems (be it AI, be it plagiarism) the same way as I have presented it. Because they need employees who are able to think for themselves - no hangers-on who always say "yes and amen" (just to don't put their own advantages in danger...).

I would like to hope that Steemit Steam thinks the same way, and I would like to hear their opinion to dispel doubts. It is very good when there is a clear and specific algorithm of work, but I understand that it is impossible to foresee all situations. However, I always want more certainty in my work :)

всё очень просто проверяется и объясняется. На скрине проверка моего текста, который был написан очень быстро по ходу создания поста. Разумеется, я не использовала никаких посторонних интеллектов при написании на русском языке. Но для публикации я сделала автоперевод на английский и он меня устроил без редактирования. Сейчас я этот текст загрузила в https://openai-openai-detector.hf.space/

и не удивилась результату, потому что любой транслит этим AI и является и любой куратор может предъявить мне выговор за использование автопереводчика :)).

Вывод: в этих проверках полностью отсутствует смысл.

Снимок экрана (5402)_cr.jpg

А далее ещё интереснее: это мой текущий комментарий, при написании которого я не использовала ни автоперевод, ни тем более, генератор текста:

Снимок экрана (5403)_cr.jpg

Я думаю что 7% - это то, что в приведённой в тексте ссылке. Всё, что он узнал.

Так что труды модераторов по распознаванию применения AI не могут принести никакой пользы, но они приносят пользу своим владельцам, потому как, так называемые "точные данные" нельзя получить бесплатно. Но точны они будут ровно настолько же.

С плагиатом они пока ещё справляются. Вот это им, наверное, и можно как-то пока доверять.

Да тут сама прблема высосана из пальца ( исключительно ради ЧСВ модераторов и какой то видимости оправдания стимкуров).
Контент, созданный с использованием ИИ - он таки создан. Это не плагиат, не копипаста. В его природе нет ничего противозаконного.
Что бы получить текст из ChatGPT, надо сперва написать промпт, а это не так просто и за одну итерацию может не получиться. Потом текст надо таки вычитать, потому что там тоже могут оказаться сюрпризы.
В любом млучае - это вполне себе работа.
А если уж вставать на священную войну против нейросетей, ну тогда и фотошоп надо запрещать, и лайтрум, и текстовые редакторы...

Короче - очередная блажь морализдов.
И что отдельно доставляет , морализдов-карусельщиков - у самих рыльце настолько "в пушку" , что света не видно, но озаботились "соломинкой". Крипто-"гретытунберг", мля...

меня, вообще-то, буквально тошнит от сгенерированных текстов. Они отличаются полной внутренней пустотой при иллюзии наличия какой-то формы. Я их и без сервисов сразу распознаю, когда они на знакомом языке. Но инструмент для борьбы с этим явлением вижу один - не прикасаться.

Дык и меня тошнит.
Да и любого нормального человека - тоже.
Как впрчем и любой человек с IQ не меньше даузначного, сумеет распознать "творение AI" безо всяких детекторов лжи. (Именно по тошноте, кстати и распознает)
И тест Тьюринга уж 70 лет как существует - не надо ничего изобретать.

Но проблема , вынесенная топикстартером в обмуждение, ИМХО ровно обратная. Она на самом деле состоит в том , что бражка стимкуратров, в погоне за своим быстрым зароботком, выкормила целые толпы производителей говно-контента, за качество которого было бы стыдно даже самому примитивному боту. И теперь, когда планка этого качества повсеместно уже ЗАФИКСИРОВАНА ( пост 300 слов, любого лизоблюдского шлака), и когда люди смекнули, что "такие посты даже курица асилит", а смекнув, просто включили "нейро-курицу", что бы та за них кудахтала ради апа, теперь, все эти "дартаньяны" вдруг озаботились авторской моралью.

"Мойша! Вы таки либо крестик снимите, либо - трусы оденьте"(с)

Трудно не согласиться)

Я для этого и тему поднимаю, что пора изменить правила курации в вопросе проверки текстов на AI. Результат проверки даже 3-4 сервисами неудовлетворительный.

Плагиат да, там по результату ссылка на первоисточник выдаётся. Здесь пока всё однозначно.

вот если сейчас проверить все комментарии под этим постом на AI, то будет очень наглядный пример. Мне лень после того, как какой-то из предложенных тобой сервисов 100 процентно сгенерированный стишок определил на 100% авторским. С этим мне уже всё ясно.

Вы предлагаете производить проверку в нескольких и в нескольких платить за якобы уточнённые результаты. И с этим мне уже всё ясно - ничего, кроме коммерции.

Платить не предлагаю, сайты эти все бесплатные (под задачу такой поверки, другие не пробовал).
Вот результат проверки твоего комента, если интересно :)

image.png

Я бы предложил на AI вообще не проверять, поскольку только путаница возникает и нет гарантии достоверности результатов.

мне этот сервис на всё пишет, что оно человеческое ))

... и это правильно)

даже когда я точно знаю, что это генерил ИИ?

да не на всё он пишет, я его пользовал.
Разные результаты.

Плагиат да, там по результату ссылка на первоисточник выдаётся. Здесь пока всё однозначно.

Не настолько однозначно. Алексмув, не стесняясь наврал в своем отчетике и ссылочку привел про мой пост, как на копипасту. Известный врунишка, кстати. Но все ему поаплодировали как гениальному разработчику и щедро апнули, хе-хе.

те сайты, которыми я пользовался для проверки плагиата, выдают ссылки на первоисточники, где они обнаружили совпадения и процент совпадений. Алгоритм простой и химичить тут... ну не знаю, что для этого нужно. Иногда могут дать ссылку на сам сайт, с которого взят текст для проверки. Часто бывает, что проверяемый текст определяется как 100% плагиат и даётся ссылка на пост Стима, который сейчас и проверяю.
Возможно и ваш был таким же "плагиатом", просто проверяющий не обратил внимание на первоисточник.

Вы правы, совсем не так однозначно с проверкой плагиата, как кажется.

Проверка плагиата - ещё один вид ханжества и фарисейства местных бизнесмЭнов-"блюстителей морали". Люди бесстыже наколачивают себе кошельки каруселями и договорняками , изображая бурную деятельность по "#развитию-крипто-сообщества", и при этом у них хватает совести эпично возбуждаться, разглядев соломинку в чьём-то глазу.
А так, ежели за холку аккуратненько такого "блюстителя" взять, да внимательно на него посмотреть - там статей на половину уголовного кодекса по каждому "криптоактивисту" на два пожизненных хватит. Можно спокойно сразу сажать и только через пять-восемь лет начинать следствие. То-то они в основном и учат нас из лондонов и вильнюсов (до недавней поры из Куева учили, но теперь им не до соломинок там в Куеве, хе-хе...)

Вот так вот интересно устроено, как ни странно. Кто-то кроссворды разгадывает, а у кого-то все ради общения. ;-)

Ради общения вообще то и придуманы движки соцсетей. Моннетизация - вторична.
БизнесмЭны просто об этом забывают ( или не подозревают по тупости своей пустоголовой)
За кроссвордами ходить сюда не надо.
И деньги можно делать куда как веселей в отведенных для этого местах.
Но бизнес-дурачье лезут - куда их не звали. А засрав всё везде и засвиначив, принимаются хрюкать чо та там "про мораль".

Все эти "проблемы" , что они так горячо обсуждают : копипаста, плагиат, искусственный интеллект - от их же свинства и происходят.
Ведь всё же очевидно. Если пост хороший и тема годная, то его обсуждает много людей, появляется много комментов, идут диалоги. Вот вам и оценка "качества контента". Она логично вытекает из трафика обмена транзакциями ( как и должен работать блокчейн). Вместо этого, живчики ищут способы накрутки под китовый ап - одну единственную , но очень жжжиирную транзу - каруселят, лижут жопы стимкурам... Это они называют "Развивать Стим".
А потом начинают как крысы на помойке драться за право считать свою накрутку "честнее" других.
Свиньи.
Фу - быть таким.

На Steemit можно наглядно посмотреть, что будет если все вдруг решат стать бизнесменами. :)

Если пропустить подробности, то в итоге придём к СВО :)
Цели, кстати, буду те же : денацификация и демилитаризация :)))

Loading...
 last year (edited)

Приветствую тебя, друг @bambuka.

Важно сообщить вам, что инструмент Openai работает только для английского языка, на самом деле, я считаю, что большинство из них запрограммированы на поиск только на этом языке, поэтому результаты ненадежны.


Greetings friend @bambuka.

It is important to let you know that the Openai tool only works for the English language, in fact, I believe that most of them are programmed to search only in this language, in such a way that the results are not reliable.

The fact is that checking texts for the presence of AI is one of the conditions for curation by the Steemit team.. I am aware that even auto-translators use AI and any translated text is partly a product of AI. That's the problem.

I can only tell you that I occasionally run my own texts through these detectors: with a 50:50 probability I am an AI ;-)) Seriously, I wrote about how it might be more useful to rely on interaction with authors and a sense of language in terms of form and expression. So far I've found a few accusations where I actually think the authors of the posts are beyond reproach. And that is unattractive. Add to that the fact that more and more (young) people will read and consume massive amounts of AI-generated texts. Their writing style will automatically follow suit at some point. At that point, at the latest, it will no longer be possible to distinguish between them.

That's the problem.
The reliability of the test results has raised my doubts for a long time, but...

The fact is that checking texts for the presence of AI is one of the conditions for curation by the Steemit team. I am aware that even auto-translators use AI and any translated text is partly a product of AI.

Apparently it's time to change the rules for checking texts for curation.

Yes, kind of like the concept of singularity. It makes sense that one day, "it will no longer be possible to distinguish between them."

with the advent of chatgpt, while there are benefits in some sectors, unfortunately there are also quite a few downsides. At one point there is complete confusion about what is true and what is not.

The reason for the confusion is that 99% of the content on Steemit is garbage.
These slags are created by living people. But their intelligence is very low. However, the curators supported this slag and received income. As a result, Steemit's bad standard is built, ignoring the content of the text. In this situation, it will be too late to regret that someone publishes messages through AI.

However, if someone thinks otherwise, then the solution is the opposite. No need to fight AI. It is necessary to improve the procedure for evaluating content by living people. For example, to reward with replicas in dialogues. You can often see that the answer stated in the comet is much more helpful than the question in the post. But the curator rewards the post. And more valuable commentary content will go unrewarded. Lack of motivation for productive communication. At the same time, no matter how bizarre the ChatGPT algorithm is, it is not a problem for a living person to recognize it during a dialogue

Hopefully times will not come when man will be redundant and robots will take over the world. :)

Many people are redundant now. Laziness, stupidity, parasitism on other people...
But the world will be taken over not by robots, but by barbarians. It always happens that way.

роботам не нужны деньги, роботы в рабстве у тех, кому они нужны.

I agree, the world is changing before our eyes and not always in the desired direction.

Coin Marketplace

STEEM 0.20
TRX 0.13
JST 0.030
BTC 66666.50
ETH 3503.76
USDT 1.00
SBD 2.71