FoundryPlateforme pour la création, le test et l'entraînement d'agents d'intelligence artificielle navigant sur le Web.

4.8 (4)

Évalué par Daniel Nikulshyn·Mis à jour mai 2026

AI Agents Web Automation Developer Tools Testing & Evals Training Benchmarking Debugging

Aperçu

Foundry est une plate-forme de développement axée sur les agents d'intelligence artificielle qui opèrent sur le Web. Elle offre aux développeurs l'infrastructure nécessaire pour concevoir des agents, les exécuter sur des tâches de navigation réelles ou simulées, et itérer sur leur comportement grâce à des évaluations structurées. Au-delà de la construction, Foundry met l'accent sur la boucle de formation et de test. Les développeurs peuvent évaluer les performances des agents, capturer les cas d'échec et affiner les modèles ou les invites pour améliorer la fiabilité sur des tâches telles que la navigation, le remplissage de formulaires, l'extraction de données et les workflows à plusieurs étapes. L'outil est destiné aux équipes qui déploient des agents de navigateur de niveau production qui ont besoin d'une évaluation répétable, d'une visibilité de débogage et d'une amélioration continue plutôt que de scripts ponctuels.

Fonctionnalités clés

Environnement de développement de l'agent
Test automatisé sur des tâches de navigation
Workflows de formation et de réglage fin
Benchmarking de performances et d'évaluations
Débogage et inspection de traces
Outils d'amélioration itérative

Tarifs

Modèle: Free
Catégorie: AI Infrastructure & MLOps
Note: 4.8 / 5 (4)

Cas d’usage

Créer des agents web navigant de production

Concevez et améliorez les agents d'intelligence artificielle qui naviguent sur les sites Web, remplissent des formulaires et mettent en œuvre des workflows multi-pas en utilisant l'environnement de développement dédié de Foundry.

Évaluer la fiabilité des agents

Exécutez des tests automatiques sur des tâches de navigation réelles ou simulées et utilisez des évaluations structurées pour mesurer les performances et suivre les améliorations au fil du temps.

Déboguer et résoudre les modes de panne

Inspectez les traces des exécutifs d'agents pour faire apparaître les cas de panne, puis améliorez les requêtes ou les modèles pour améliorer la dépendabilité sur les tâches de navigation et d'extraction de données.

Former et réglage fin des modèles de navigation

Profitez des workflows de formation pour améliorer continuellement le comportement des agents, en transformant les panne capturés en données pour le cycle d'itération suivant.

Pour & contre

Pour

Conçu spécifiquement pour les agents de navigation Web
Supporte le workflow complètement allant de la création à la formation
Aide à la découverte et à la résolution de modes de panne d'agents
Encourage l'évaluation répétable
Limités

Contre

Focalisation étroite sur les cas d'utilisation de navigation
Peut nécessiter des compétences en ingénierie
Limites de l'information publique sur les prix et les limites

Avis

4.8

Moyenne sur 4 avis.

Connecte-toi pour laisser un avis.

Priya Nair

Apr 7, 2026

Years in this space

I've evaluated a lot of these over the years. What stands out here is agent development environment — handled better than most — and encourages repeatable evaluation. Likely requires engineering expertise is my one real gripe. Worth the time if this is your use case.

Sofia Lindqvist

Dec 18, 2025

Does the job

Pretty happy overall. Debugging and trace inspection just works and helps surface and fix agent failure modes. but no dealbreakers — I'd recommend it to a friend without hesitating.

Pierre Dubois

Oct 28, 2025

Skeptical, then convinced

I went in skeptical — most tools in this space overpromise. It actually delivers on iterative improvement tooling, and helps surface and fix agent failure modes caught me off guard. still, I'd recommend giving it a real trial.

Rina Desai

Sep 25, 2025

Use it every day

Honestly didn't expect to like it this much. Performance benchmarking and evals is exactly what I needed, and encourages repeatable evaluation. but I reach for it almost every day now and it just clicks.