


De nombreux médias majeurs bloquent les robots d'exploration OpenAI
Depuis qu'OpenAI a lancé des modèles d'intelligence artificielle générative de contenu, les données sur Internet ont été largement utilisées pour former et améliorer ces modèles. Cependant, selon une enquête de l’Institut Reuters, de plus en plus de médias ont commencé à exprimer des doutes sur la collecte de données d’OpenAI, et même plus de 50 % des médias traditionnels s’y opposent. Cela démontre des préoccupations croissantes concernant la confidentialité et l’utilisation des données et rappelle la nécessité de plus de transparence et de conformité à mesure que l’IA se développe.
L'Institut Reuters a analysé de nombreux médias d'information grand public tels que le New York Times, le Wall Street Journal, le Washington Post, CNN et NPR, couvrant 10 pays, dont les États-Unis, le Royaume-Uni, l'Allemagne et l'Inde, et les a comparés. classés en trois catégories : les médias imprimés traditionnels (médias papier), les médias radiophoniques et télévisuels et les médias numériques. L'étude a révélé que 57 % des médias imprimés traditionnels bloquaient les robots d'exploration d'OpenAI, et que les proportions des médias audiovisuels et télévisés et des médias numériques étaient respectivement de 48 % et 31 %.
L'étude a également souligné qu'il existe des différences significatives dans la proportion de sites d'information qui bloquent OpenAI selon les pays et les régions. Aux États-Unis, cette proportion atteint 79 %, alors qu'au Mexique et en Pologne elle n'est que de 20 %.
La différence dans la proportion de médias d'information dans les 10 pays étudiés qui ont pris des mesures de blocage contre les robots d'exploration OpenAI
De plus, 97 % des médias d'information qui ont bloqué les robots d'exploration OpenAI ont également bloqué les robots d'exploration Google AI.
Certaines études révèlent que les médias d'information se méfient de l'utilisation de l'intelligence artificielle dans leurs contenus. Ils craignent que si les gens obtiennent des informations grâce à l’intelligence artificielle, cela pourrait conduire à la marginalisation ou au remplacement des médias. Andrew Frank, vice-président et analyste distingué chez Gartner, a déclaré : « Les recherches de Reuters mettent en évidence un défi majeur auquel est confrontée l'IA générative : son fonctionnement repose sur du contenu réel créé par de vraies personnes qui peuvent le considérer comme inapproprié. Une menace potentielle pour leurs moyens de subsistance. »
Récemment, une étude de l'Université Cornell a noté que « les modèles ont tendance à se développer lorsque les nouveaux modèles d'intelligence artificielle s'appuient principalement sur les données fournies par les modèles précédents plutôt que sur les humains lors d'un « effondrement » ou d'un état dégénéré. Cela conduit à davantage d’erreurs dans les informations générées par les systèmes d’IA. Ce phénomène met en évidence les risques et défis potentiels dans le domaine de l’intelligence artificielle, qui nécessitent des recherches et des discussions plus approfondies. Les résultats de cette étude nous rappellent qu'il faut être prudent quant aux sources de données et aux méthodes de formation lors du développement d'une technologie d'intelligence artificielle. Début août de l'année dernière, OpenAI a lancé un robot d'intelligence artificielle, et Google a ensuite lancé un produit similaire en septembre. L’étude note que si ces médias prennent la décision de bloquer, il pourrait être difficile de revenir sur cette position et de les débloquer.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds











En 2023, la technologie de l’IA est devenue un sujet brûlant et a un impact énorme sur diverses industries, notamment dans le domaine de la programmation. Les gens sont de plus en plus conscients de l’importance de la technologie de l’IA, et la communauté Spring ne fait pas exception. Avec l’évolution continue de la technologie GenAI (Intelligence Artificielle Générale), il est devenu crucial et urgent de simplifier la création d’applications dotées de fonctions d’IA. Dans ce contexte, « SpringAI » a émergé, visant à simplifier le processus de développement d'applications fonctionnelles d'IA, en le rendant simple et intuitif et en évitant une complexité inutile. Grâce à « SpringAI », les développeurs peuvent plus facilement créer des applications dotées de fonctions d'IA, ce qui les rend plus faciles à utiliser et à exploiter.

OpenAI a récemment annoncé le lancement de son modèle d'intégration de dernière génération, embeddingv3, qui, selon eux, est le modèle d'intégration le plus performant avec des performances multilingues plus élevées. Ce lot de modèles est divisé en deux types : les plus petits text-embeddings-3-small et les plus puissants et plus grands text-embeddings-3-large. Peu d'informations sont divulguées sur la façon dont ces modèles sont conçus et formés, et les modèles ne sont accessibles que via des API payantes. Il existe donc de nombreux modèles d'intégration open source. Mais comment ces modèles open source se comparent-ils au modèle open source open source ? Cet article comparera empiriquement les performances de ces nouveaux modèles avec des modèles open source. Nous prévoyons de créer une donnée

Auteur丨Compilé par TimAnderson丨Produit par Noah|51CTO Technology Stack (WeChat ID : blog51cto) Le projet d'éditeur Zed est encore en phase de pré-version et a été open source sous licences AGPL, GPL et Apache. L'éditeur offre des performances élevées et plusieurs options assistées par l'IA, mais n'est actuellement disponible que sur la plate-forme Mac. Nathan Sobo a expliqué dans un article que dans la base de code du projet Zed sur GitHub, la partie éditeur est sous licence GPL, les composants côté serveur sont sous licence AGPL et la partie GPUI (GPU Accelerated User) l'interface) adopte la Licence Apache2.0. GPUI est un produit développé par l'équipe Zed

Si la réponse donnée par le modèle d’IA est incompréhensible du tout, oseriez-vous l’utiliser ? À mesure que les systèmes d’apprentissage automatique sont utilisés dans des domaines de plus en plus importants, il devient de plus en plus important de démontrer pourquoi nous pouvons faire confiance à leurs résultats, et quand ne pas leur faire confiance. Une façon possible de gagner confiance dans le résultat d'un système complexe est d'exiger que le système produise une interprétation de son résultat qui soit lisible par un humain ou un autre système de confiance, c'est-à-dire entièrement compréhensible au point que toute erreur possible puisse être trouvé. Par exemple, pour renforcer la confiance dans le système judiciaire, nous exigeons que les tribunaux fournissent des avis écrits clairs et lisibles qui expliquent et soutiennent leurs décisions. Pour les grands modèles de langage, nous pouvons également adopter une approche similaire. Cependant, lorsque vous adoptez cette approche, assurez-vous que le modèle de langage génère

Ollama est un outil super pratique qui vous permet d'exécuter facilement des modèles open source tels que Llama2, Mistral et Gemma localement. Dans cet article, je vais vous présenter comment utiliser Ollama pour vectoriser du texte. Si vous n'avez pas installé Ollama localement, vous pouvez lire cet article. Dans cet article, nous utiliserons le modèle nomic-embed-text[2]. Il s'agit d'un encodeur de texte qui surpasse OpenAI text-embedding-ada-002 et text-embedding-3-small sur les tâches à contexte court et à contexte long. Démarrez le service nomic-embed-text lorsque vous avez installé avec succès o

Il n'y a pas si longtemps, OpenAISora est rapidement devenu populaire grâce à ses étonnants effets de génération vidéo. Il s'est démarqué parmi la foule de modèles vidéo littéraires et est devenu le centre d'attention mondiale. Suite au lancement du processus de reproduction d'inférence de formation Sora avec une réduction des coûts de 46 % il y a 2 semaines, l'équipe Colossal-AI a entièrement open source le premier modèle de génération vidéo d'architecture de type Sora au monde "Open-Sora1.0", couvrant l'ensemble processus de formation, y compris le traitement des données, tous les détails de la formation et les poids des modèles, et joignez-vous aux passionnés mondiaux de l'IA pour promouvoir une nouvelle ère de création vidéo. Pour un aperçu, jetons un œil à une vidéo d'une ville animée générée par le modèle « Open-Sora1.0 » publié par l'équipe Colossal-AI. Ouvrir-Sora1.0

Il a été révélé que Microsoft et OpenAI investissaient de grosses sommes d’argent dans une start-up de robots humanoïdes au début de l’année. Parmi eux, Microsoft prévoit d'investir 95 millions de dollars et OpenAI investira 5 millions de dollars. Selon Bloomberg, la société devrait lever un total de 500 millions de dollars au cours de ce cycle, et sa valorisation pré-monétaire pourrait atteindre 1,9 milliard de dollars. Qu'est-ce qui les attire ? Jetons d’abord un coup d’œil aux réalisations de cette entreprise en matière de robotique. Ce robot est tout argenté et noir, et son apparence ressemble à l'image d'un robot dans un blockbuster de science-fiction hollywoodien : maintenant, il met une capsule de café dans la machine à café : si elle n'est pas placée correctement, elle s'ajustera sans aucun problème. télécommande humaine : Cependant, après un certain temps, une tasse de café peut être emportée et dégustée : Avez-vous des membres de votre famille qui l'ont reconnu ? Oui, ce robot a été créé il y a quelque temps.

Pratique du robot d'exploration Java : Comment explorer efficacement les données d'une page Web Introduction : Avec le développement rapide d'Internet, une grande quantité de données précieuses est stockée dans diverses pages Web. Pour obtenir ces données, il est souvent nécessaire d’accéder manuellement à chaque page web et d’en extraire les informations une par une, ce qui est sans doute une tâche fastidieuse et chronophage. Afin de résoudre ce problème, les utilisateurs ont développé divers outils de robots d'exploration, parmi lesquels le robot d'exploration Java est l'un des plus couramment utilisés. Cet article amènera les lecteurs à comprendre comment utiliser Java pour écrire un robot d'exploration Web efficace et à démontrer la pratique à travers des exemples de code spécifiques. 1. La base du reptile
