Nous avons mis en place une infrastructure cloud scalable de crawlers permettant de déployer des crawlers / scrappers à l'échelle. Cette infrastructure nous sert entre autre pour opérer Apercite, mais également pour des besoins spécifiques de clients : captures d'écran, SEO, extraction de texte, extraction d'adresses, recherche d'entités ...
Nos robots supportent l'utilisation de Chrome (donc pouvant exécuter les Javascripts, et supportant très bien les applications React, Angular et cie), ou de simples requêtes HTTP (plus rapide, mais un peu plus restreint), selon vos besoins.
En sortie, vous pouvez récupérer un tableau de données (XLS, CSV), des captures d'écran, des fichiers PDF, ou tout autre format et contenu que vous souhaitez (moyennant développements spécifiques).
Nos prix varient en fonction du type de crawler et de leur nombre. En fonction de votre demande, des développements spécifiques et/ou des serveurs spécifiques supplémentaires peuvent être à prévoir.
Vous avez un projet ? Laissez-nous votre numéro téléphone et nous vous rappelons pour en parler 15 minutes !
Nous utiliserons ces informations pour vous appeler et uniquement pour cela.
Vous pouvez aussi nous contacter par mail.
Vous avez un projet ? Laissez-nous votre numéro téléphone et nous vous rappelons pour en parler 15 minutes !
Nous utiliserons ces informations pour vous appeler et uniquement pour cela.
Vous pouvez aussi nous contacter par mail.
Vous avez un projet ? Laissez-nous votre numéro téléphone et nous vous rappelons pour en parler 15 minutes !
Nous utiliserons ces informations pour vous appeler et uniquement pour cela.
Vous pouvez aussi nous contacter par mail.
Nos tarifs sont calculés au plus juste en fonction du nombre de threads qui vous sont dédiés. Un thread est un élément de la ferme permettant de traiter une requête en simultané (que ce soit la partie vérifications, réseau (dns, tcp, http, ...), normalisation, post-processing, etc.). Plus vous avez de threads, plus vous pouvez en théorie crawler rapidement mais attention : un thread inactif (lancé, mais inoccupé) est facturé.
La capacité réelle de crawl dépends non seulement de la capacité de la ferme à envoyer des requêtes, mais également de la capacité des serveurs distants à traiter et répondra à ces requêtes.
Tarifs mensuels 2019 (engagement minimal de 80 threads sur un mois, facturation à la journée au delà).
(*) KPPJ : Capacité en millier de pages par jour, en fonction d'un timeout (TO) configuré.
À ces prix peuvent s'ajouter :
- Développements spécifiques.
- Serveurs de base de donnée (dans le cas d'un livrable sous forme de DB SQL).
- Charges de stockage cloud (dans le cas d'un livrable sous forme de bucket S3 ou équivalent).
- Utilisation de mandataires résidentiels ou en data-centres.
- Autre demande spécifique.
En fonction du volume commandé, nous pouvons vous proposer une réduction contre un engagement de volume. N'hésitez pas à nous parler de votre besoin !
Contactez-nous pour en discuter !
Vous avez un projet ? Laissez-nous votre numéro téléphone et nous vous rappelons pour en parler 15 minutes !
Nous utiliserons ces informations pour vous appeler et uniquement pour cela.
Vous pouvez aussi nous contacter par mail.