Analyse comparative de la technologie de ZoomAgri et des méthodes fondées sur l’ADN pour évaluer la pureté variétale de l’orge

Auteurs : Marta S. Izydorczyk, Tigst Demeke, Sean Walkowiak

Résumé

Le présent rapport fait état des résultats d’une analyse comparative réalisée par le Laboratoire de recherches sur les grains afin d’évaluer l’exactitude et la concordance des évaluations de la pureté variétale d’échantillons d’orge qui ont été effectuées au moyen de la technologie de ZoomAgri, laquelle repose sur la reconnaissance d’images, par rapport à la méthode normalisée de génotypage fondée sur l’ADN utilisée actuellement.

La pureté variétale est un paramètre de qualité essentiel dans la chaîne d’approvisionnement en orge, car les malteurs et les acheteurs exigent généralement un pourcentage minimal de pureté variétale de 95 % pour garantir la qualité du produit et éviter des pénalités financières. Les méthodes fondées sur l’analyse de l’ADN sont largement considérées comme la norme d’excellence pour l’évaluation de la pureté variétale, en raison de leur haute spécificité et de leur capacité de reconnaissance d’un grand nombre de variétés. Cependant, ces méthodes demeurent coûteuses et chronophages. En revanche, la société ZoomAgri propose une technologie qui a une approche novatrice et qui utilise la reconnaissance d’images assistée par l’intelligence artificielle, ce qui réduit considérablement le coût et le temps d’exécution des analyses.

Le Laboratoire de recherches sur les grains a analysé 71 échantillons d’orge en utilisant ces deux techniques. Les échantillons représentaient six variétés d’orge brassicoles couramment cultivées au Canada — AC Metcalfe, CDC Copeland, AAC Synergy, AAC Connect, CDC Fraser, et CDC Churchill — et une variété d’orge à des fins générales — CDC Austenson.

Une analyse statistique effectuée à l’aide du coefficient de corrélation de concordance (CCC) de Lin a révélé une forte concordance entre les deux méthodes, les valeurs du CCC atteignant 0,98 et les estimations de la pureté variétale se situant généralement dans une plage de ± 5 %. Les tracés de Bland-Altman ont confirmé cette concordance, montrant des écarts moyens avoisinant zéro et des limites de concordance étroites, ce qui indique un biais minime et une variabilité acceptable. Dans le cas de certaines variétés, comme AAC Connect et CDC Churchill, la technologie de ZoomAgri basée sur la reconnaissance d’images a respectivement surestimé et sous-estimé légèrement la pureté variétale, mais les écarts entre les estimations sont demeurés dans une plage de ±5 %.

Les tests de répétabilité ont démontré une grande précision entre les répétitions, renforçant ainsi la fiabilité des évaluations de la technologie de ZoomAgri.

Ces résultats indiquent que les estimations de pureté variétale des six variétés d’orge brassicole couramment cultivées au Canada (AC Metcalfe, CDC Copeland, AAC Synergy, AAC Connect, CDC Fraser et CDC Churchill) par la technologie de ZoomAgri sont à la fois fortement corrélées et numériquement cohérentes avec les résultats de génotypage.

Même si la technologie de ZoomAgri est capable de reconnaître actuellement un moins grand nombre de variétés que les méthodes fondées sur l’ADN, sa rapidité, son faible coût par analyse et son exactitude en font un outil prometteur pour la réalisation d’évaluations de pureté variétale de routine, notamment dans les contextes opérationnels qui exigent une prise de décision rapide. De futures validations sur une gamme plus étendue de génotypes d’orge et de conditions environnementales amélioreront encore l’utilité de cette technologie.

Les résultats présentés ici rendent compte uniquement des résultats qui ont été obtenus au moyen de la version, de la base de données et de la méthode analytique précises qui étaient accessibles lors de la réalisation des essais. Il se peut qu’ultérieurement, ZoomAgri mette à jour l’un de ces trois éléments utilisés dans sa technologie d’analyse d’images. Il convient également de noter que les échantillons analysés ont été reçus et analysés au cours de deux campagnes agricoles distinctes.

Contexte

La pureté variétale est un facteur déterminant de la qualité et de la valeur marchande de l’orge brassicole. Les acheteurs canadiens et étrangers exigent généralement une pureté variétale minimale de 95 % dans leurs contrats d’achat. Le non-respect de ce seuil entraîne souvent des pénalités financières pour les producteurs et les compagnies céréalières, ce qui souligne la nécessité de disposer de méthodes d’identification variétale qui soient fiables et rapides et qui offrent un bon rapport coût-efficacité.

Les premières méthodes d’identification des variétés d’orge reposaient sur l’extraction des protéines et leur séparation par des techniques telles que l’électrophorèse sur gel, la chromatographie liquide à haute performance et la spectrométrie de masse (Marchylo, 1987; Marchylo and Mellish, 1992). Malgré leur intérêt scientifique, ces méthodes n’offraient pas une résolution suffisante en raison de la variation limitée des protéines dans les grains d’orge des variétés élites.

Les méthodes fondées sur l’ADN ont un pouvoir de résolution nettement supérieur en raison de l’abondance et de la spécificité des marqueurs d’ADN qui peuvent être développés pour chacune des variétés d’orge. Ces marqueurs sont cohérents entre les tissus et les stades de développement du grain et peuvent être utilisés pour analyser le malt, ce qui les rend très pertinents pour l’industrie brassicole.

Aujourd’hui, les méthodes fondées sur l’ADN sont considérées comme la norme d’excellence pour l’identification des variétés, car elles sont appréciées pour leur exactitude, leur spécificité et leur reproductibilité.

Le Laboratoire de recherches sur les grains a récemment mis au point une méthode fondée sur l’ADN améliorée en utilisant 24 tests de génotypage TaqMan® sur mesure qui sont analysés au moyen du système SmartChip à haut débit de Takara Bio Inc. (Sung-Jong et al., 2024). Cette méthode permet d’identifier plus de 124 variétés d’orge canadienne, conserve une grande exactitude et offre de la souplesse, un débit plus élevé et un meilleur rapport coût-efficacité par rapport aux méthodes précédentes. Ses principales limites demeurent son coût élevé par analyse et un temps d’exécution relativement long.

  • Coût : environ de 600 à 1200 dollars par échantillon.
  • Temps d’exécution : de 24 à 48 heures par analyse.

La société ZoomAgri a introduit une nouvelle approche d’identification variétale qui repose sur l’imagerie numérique et l’intelligence artificielle pour l’identification de variétés d’orge. Le grand avantage de cette technologie est la réduction des coûts et du temps d’exécution.

  • Coût : environ 15 dollars par échantillon.
  • Temps d’exécution : environ 3 minutes par analyse.

Réalisant le potentiel de cette technologie de ZoomAgri, le Laboratoire de recherches sur les grains a procédé à des tests pour évaluer son efficacité et l’exactitude de ses déterminations de la pureté variétale d’échantillons d’orge brassicole canadienne.

Objectif

L’objectif de la présente étude était d’évaluer la concordance et l’exactitude des évaluations de la pureté variétale d’échantillons d’orge obtenues au moyen de la technologie de ZoomAgri, par rapport à la méthode de génotypage normalisée élaborée par le Laboratoire de recherches sur les grains et utilisée actuellement.

Matériel et méthodes

Le Laboratoire de recherches sur les grains a obtenu 71 échantillons d’orge, dont 54 échantillons de la campagne agricole 2023 et 17 échantillons de la campagne agricole 2024. Ces échantillons proviennent des échantillons reçus dans le cadre du Programme d’échantillons de récolte de la Commission canadienne des grains, de l’enquête annuelle sur les récoltes d’orge et du programme de surveillance des cargaisons. Le tableau 1 présente la répartition des variétés d’orge individuelles qui ont été utilisées dans le cadre de la présente étude.

Tableau 1  Variétés d’orge et nombre d’échantillons analysés
Variété Nombre d’échantillons analysés
AAC Connect 21
CDC Copeland 18
AAC Synergy 12
CDC Churchill 8
CDC Fraser 6
AC Metcalfe 4
CDC Austenson 2

Des sous-échantillons d’environ 20 grammes (équivalant à 250-400 grains) ont été prélevés dans chaque échantillon d’orge, placés sur un plateau quadrillé qui conserve les grains séparés, puis numérisés au moyen de l’appareil de ZoomAgri (figure 1). Après analyse par reconnaissance des images numériques, tous les grains ont été récupérés et conservés, et 108 grains individuels récupérés ont été sélectionnés pour une extraction d’ADN et une analyse génétique.

L’ADN des grains individuels a été extrait en utilisant un appareil à 96 puits selon le protocole décrit par Perry et Lee (2015). Les échantillons d’ADN obtenus, ainsi que les tests de génotypage TaqMan®, ont été chargés dans le système SmartChip au moyen du MultiSample NanoDispenser de Takara Bio Inc., puis combinés avec le master mix pour PCR quantitative du SmartChip de Takara Bio Inc., selon les instructions du fabricant, et ont ensuite été analysés selon les méthodes décrites par Sung-Jong et al., 2024.

Figure 1  Aperçu du flux de travail analytique; une analyse d’images numériques des grains a d’abord été effectuée au moyen de l’appareil de ZoomAgri (A), puis, après récupération des grains, une extraction de leur ADN a été faite pour effectuer un génotypage au moyen du système SmartChip (B).

A : Échantillon d’environ 20 g (250-400 grains).

l’appareil de ZoomAgri

B : 108 grains analysés par génotypage.

système SmartChip

Résultats

Capacités de reconnaissance variétale de la technologie de ZoomAgri comparées à celles des méthodes fondées sur l’ADN

La technologie de ZoomAgri évalue la pureté variétale d’échantillons d’orge par la numérisation d’environ 250 à 350 grains individuels et par la reconnaissance d’images au moyen de l’intelligence artificielle pour l’identification de chaque variété. Les résultats d’évaluation de la composition d’un échantillon sont exprimés en pourcentage de chaque variété qui est présente dans un échantillon. Au moment de la réalisation des essais, le système pouvait reconnaître six variétés d’orge brassicole courantes — AC Metcalfe, CDC Copeland, AAC Synergy, AAC Connect, CDC Fraser et CDC Churchill — et quatre variétés d’orge à des fins générales : CDC Austenson, Esma, Oreana et Sirish. L’ensemble des échantillons recueillis aux fins de la présente étude comprenait les six variétés d’orge brassicole et une variété à des fins générales, CDC Austenson (tableau 1).

En revanche, la méthode fondée sur l’ADN récemment mise au point par le Laboratoire de recherches sur les grains utilise 24 tests de génotypage TaqMan® sur mesure qui sont analysés au moyen du système SmartChip. Cette approche permet d’identifier plus de 124 variétés d’orge canadienne avec une grande exactitude analytique, et offre une plage de détection nettement plus étendue que les capacités actuelles de la technologie de ZoomAgri.

Répétabilité des résultats obtenus au moyen de la technologie de ZoomAgri

Pour évaluer la répétabilité des résultats obtenus avec la technologie de ZoomAgri, trois échantillons d’orge — CDC Fraser, CDC Copeland et AAC Synergy — ont été sélectionnés, chacun représentant des compositions variétales différentes. Pour chaque échantillon, un sous-échantillon de 20 grammes a été numérisé et analysé cinq fois. Les résultats, résumés au tableau 2, montrent une identification cohérente des variétés principales et secondaires entre les répétitions.

En ce qui concerne l’échantillon no 1, la variété principale CDC Fraser a été identifiée de manière cohérente à un pourcentage de 90 % ± 0,5 %, et la variété secondaire CDC Copeland, à un pourcentage moyen de 10 % ± 0,7 %. Pour ce qui est de l’échantillon no 2, la variété principale CDC Copeland a été identifiée de manière cohérente à un pourcentage de 98 % ± 0,6 %, et la variété secondaire CDC Fraser, à un pourcentage de 2 %. Dans le cas de l’échantillon no 3 (AAC Synergy), une parfaite répétabilité des résultats a été obtenue, la variété principale ayant été identifiée à 100 %, sans aucun pourcentage de composant secondaire détectable, et ce, dans toutes les répétitions.

Les faibles valeurs d’écart type et de coefficient de variation (de 0,0 % à 0,7 %) obtenues pour tous les échantillons indiquent une très bonne répétabilité des analyses effectuées au moyen de la technologie de ZoomAgri pour l’évaluation de la pureté variétale.

Tableau 2  Résultats de la composition variétale des trois échantillons d’orge subdivisés et analysés à répétition au moyen de la technologie de ZoomAgri
Répétition Échantillon no 1 : CDC Fraser Échantillon no 2 : CDC Copeland Échantillon no 3 : AAC Synergy
Variété principale Variété secondaire Variété principale Variété secondaire Variété principale Variété secondaire
1 89 % de CDC Fraser 11 % de CDC Copeland 98 % de CDC Copeland 2 % de CDC Fraser 100 % de AAC Synergy 0 %
2 90 % de CDC Fraser 9 % de CDC Copeland 99 % de CDC Copeland 1 % de CDC Fraser 100 % de AAC Synergy 0 %
3 90 % de CDC Fraser 10 % de CDC Copeland 99 % de CDC Copeland 1 % de DC Fraser 100 % de AAC Synergy 0 %
4 90 % de CDC Fraser 10 % de CDC Copeland 99 % de CD Copeland 2 % de CDC Fraser 100 % de AAC Synergy 0 %
5 90 % de CDC Fraser 10 % de CDC Copeland 98 % de CDC Copeland 2 % de CDC Fraser 100 % de AAC Synergy 0 %
Moyenne (%) 90 10 98 100
Écart type (%) 0,5 0,7 0,6 0
Coefficient de variation 0,5 7 0,6 0

Concordance entre la technologie de ZoomAgri et les méthodes fondées sur l’ADN pour la détermination de la pureté variétale d’échantillons d’orge

La concordance entre les résultats obtenus par la technologie de ZoomAgri et par les méthodes fondées sur l’ADN a été évaluée au moyen du coefficient de corrélation de concordance de Lin (CCC). Le CCC de Lin est une mesure statistique qui est utilisée pour évaluer la concordance entre deux ensembles de données — en particulier lorsqu’il s’agit de comparer une nouvelle méthode de mesure à une « norme d’excellence » ou à une méthode de référence. Le CCC de Lin, combinant deux éléments clés, soit la précision et l’exactitude, a été conçu pour évaluer le degré de concordance entre deux ensembles de mesures, et pas seulement leur degré de corrélation.

Tableau 3  Valeurs du coefficient de corrélation de concordance de Lin et niveaux de concordance correspondantsNote de bas de page a
Valeur du CCC Niveau de concordance
> 0,99 excellent
de 0,95 à 0,99 substantiel
de 0,90 à 0,95 acceptable
< 0,90 faible ou incohérent

Tableau 3 Notes

Tableau 3 Note 1

Selon les lignes directrices proposées par McBride (2005).

Retour à la référence de la note de bas de page a

La figure 2 présente le CCC de Lin, illustrant le niveau de concordance entre les estimations du pourcentage des principales variétés d’orge qui ont été obtenues au moyen de la technologie de ZoomAgri et de méthodes de génotypage fondées sur l’ADN. La valeur de CCC de 0,98, avec un intervalle de confiance de 95 % qui se situe de 0,96 à 0,98, indique une concordance substantielle entre les deux méthodes. Cette concordance élevée suggère que la technologie de ZoomAgri est non seulement en forte corrélation avec la méthode de référence fondée sur l’analyse de l’ADN, mais qu’elle produit également des résultats numériquement cohérents, ce qui confirme sa fiabilité comme outil alternatif pour évaluer la pureté variétale des échantillons testés.

La figure 3 présente un tracé de Bland-Altman, une autre méthode statistique qui est utilisée pour évaluer la concordance entre deux techniques de mesure. Dans ce tracé, l’axe des x représente le pourcentage moyen de chaque variété d’orge qui est estimé par la technologie de ZoomAgri et par les méthodes de génotypage, tandis que l’axe des y affiche l’écart entre les deux estimations (% par ZoomAgri moins % par analyse d’ADN). Le tracé comprend une ligne d’écart moyen (représentant le biais), qui indique si l’une des deux méthodes surestime ou sous-estime systématiquement les résultats par rapport à l’autre.

L’écart moyen observé avoisinait zéro, ce qui suggère une absence de biais systématique entre la technologie de ZoomAgri et les méthodes de génotypage. Les limites de concordance, lesquelles ont été définies comme l’écart type moyen plus ou moins 1,96, s’étendaient de -5 % à +5 %, indiquant que les écarts des estimations de la pureté variétale entre les deux méthodes se situaient généralement dans une fourchette de ±5 %. À noter que les écarts des estimations du pourcentage des variétés secondaires se situaient également dans cette fourchette. Ce niveau de concordance soutient que l’utilisation de la technologie de ZoomAgri est une méthode alternative fiable pour évaluer la composition variétale de l’orge.

La figure 4 présente des tracés de Bland-Altman pour chaque variété d’orge. Ces tracés illustrent la concordance entre les estimations du pourcentage variétal qui ont été obtenues au moyen de la technologie de ZoomAgri et des méthodes de génotypage. En ce qui concerne la variété AAC Connect, la ligne d’écart moyen de +1,6 % donne à penser que la technologie de ZoomAgri tend à surestimer légèrement la proportion de cette variété dans les échantillons analysés. À l’inverse, dans le cas de la variété CDC Churchill, la ligne d’écart moyen de -1,3 % indique que la technologie de ZoomAgri tend à sous-estimer légèrement la proportion de cette variété. Pour toutes les variétés analysées, les écarts entre les deux méthodes se situent généralement dans une plage de ±5 %.

Figure 2  Coefficient de corrélation de concordance de Lin (CCC) comparant des estimations de la composition variétale obtenues au moyen de la technologie de ZoomAgri et de méthodes fondées sur l’ADN.
La description de la figure suit.
Description textuelle

Diagramme de dispersion des résultats de ZoomAgri sur l’axe des y et des résultats fondés sur l’ADN sur l’axe des x pour les estimations des principales variétés d’orge. La ligne continue à 45° représente la concordance parfaite entre les deux méthodes, tandis que la ligne pointillée représente la concordance observée. Le diagramme montre qu’il existe une concordance substantielle entre les deux méthodes.

Figure 3  Tracé de Bland-Altman montrant la concordance entre les estimations de variétés d’orge principales et secondaires obtenues par la technologie de ZoomAgri et par des méthodes fondées sur l’ADN.
La description de la figure suit.
Description textuelle

Tracé montrant la différence entre les résultats de ZoomAgri et ceux fondés sur l’ADN sur l’axe des y et le résultat moyen des deux méthodes sur l’axe des x pour les variétés d’orge principales et secondaires. La ligne de différence moyenne est approximativement égale à 0, ce qui indique l’absence de biais systémique. Les limites de concordance varient entre -5 % et +5 %.

Figure 4  Tracés de Bland-Altman montrant la concordance entre la technologie de ZoomAgri et les méthodes fondées sur l’ADN dans l’estimation du pourcentage des variétés d’orge individuelles.

AAC Connect

La description de la figure suit.

AAC Synergy

La description de la figure suit.

CDC Copeland

La description de la figure suit.

CDC Churchill

La description de la figure suit.

CDC Fraser

La description de la figure suit.
Description textuelle

Tracés montrant la différence entre les résultats de ZoomAgri et ceux fondés sur l’ADN sur l’axe des y et le résultat moyen des deux méthodes sur l’axe des x pour chaque variété d’orge. Le tracé de la variété AAC Connect présente une ligne de différence moyenne à 1,6, ce qui indique une légère surestimation par ZoomAgri. Le tracé de la variété CDC Churchill présente une ligne de différence moyenne à -1,3, ce qui indique une légère sous-estimation par ZoomAgri. La ligne de différence moyenne est respectivement de 0,1, -0,56 et 0,9 pour les tracés des variétés AAC Synergy, CDC Copeland et CDC Fraser

Conclusions

L’étude a démontré que la technologie d’imagerie de ZoomAgri permet d’évaluer de manière fiable et exacte la pureté variétale de six variétés d’orge brassicole couramment cultivées : AC Metcalfe, CDC Copeland, AAC Synergy, AAC Connect, CDC Fraser et CDC Churchill. Les valeurs élevées du coefficient de corrélation de concordance de Lin, constamment supérieures à 0,95, indiquent une concordance substantielle entre la technologie de ZoomAgri et les méthodes de génotypage fondées sur l’ADN dans l’estimation du pourcentage des variétés d’orge principales et secondaires dans les échantillons analysés. En outre, les analyses de Bland-Altman ont révélé des biais minimes et des limites étroites de concordance, avec des écarts généralement compris dans une fourchette de ±5 %, ce qui confirme la constance des résultats de la technologie de ZoomAgri.

Bien que les méthodes fondées sur l’ADN demeurent la norme d’excellence pour l’identification de variétés en raison de leur capacité de reconnaissance étendue et de leur précision moléculaire, la technologie de ZoomAgri s’avère une option rapide et économique pour effectuer des évaluations de routine de la pureté variétale. Sa capacité à fournir des résultats quasi équivalents avec des temps de traitement considérablement réduits la rend particulièrement utile pour le contrôle de la qualité dans les industries du maltage et de la brasserie.

De futurs travaux pourraient se concentrer sur l’enrichissement de la collection d’images de la technologie de ZoomAgri qui est utilisée pour la reconnaissance variétale et sur la validation de ses résultats pour la détermination d’une gamme élargie de génotypes d’orge et de conditions environnementales. Néanmoins, les constats actuels font ressortir son potentiel d’utilisation en complément des méthodes de génotypage classiques dans certains contextes opérationnels précis.

Références

B. A. Marchylo. « Barley cultivar identification by SDS gradient page analysis of hordein ». Canadian Journal of Plant Science, vol. 67, p. 927 (1987).

B. A. Marchylo et Mellish, V.J. « The development and application of varietal identification technology at the Grain Research Laboratory ». 65e rapport annuel du Laboratoire de recherches sur les grains (1992).

G. B. McBride. Using Statistical Methods for Water Quality Management: Issues, Problems, and Solutions. New York : John Wiley & Sons (2005).

D. Perry et Sung-Jong L. « Identification of Canadian wheat varieties using OpenArray genotyping technology ». Journal of Cereal Science vol. 65, p. 267 (2015).

L. Sung-Jong, Eckhard, M., Dusabenyagasani, M., Izydorczyk, M., Demeke T., Perry, D. et Walkowiak, S. « Identification of Canadian barley varieties by high-throughput SNP genotyping ». Canadian Journal of Plant Science, vol. 104, p. 388 (2024).