汤姆·泰敏因此,请向我们介绍Microsoft的AI for Earth程序本身。我想这是您要处理的事情,很多实体都在从事此类研究。

丹·莫里斯(Dan Morris):对。因此,地球人工智能在人工智能和环境可持续发展的交汇处推动了创新。我们通过赠款来做到这一点,我们还通过与NOAA等组织密切合作通过技术开发来做到这一点,致力于解决环境科学中的问题,我们认为这些问题可以通过Cloud和AI工具得到显着加速。

汤姆·泰敏(Tom Temin):您是如何与NOAA集团合作的?

丹·莫里斯(Dan Morris):这次特别的合作有趣地讲述了故事。微软的一位同事恰好与NOAA的一位科学家一起担任陪审员。他们说起话来,她说我收到了200万封海豹的照片,这让我发疯了,我在Microsoft的同事认为,我敢打赌,我们可以帮助您使AI的生活更加轻松。几年前,这导致了一个项目,这就是我们在微软举行的一周黑客马拉松。这是一个大型的夏季活动,员工基本上从工作中抽出几天时间来从事自己热衷的工作。在此期间,许多人从事与环境科学有关的问题的研究。然后,我们建立了一些初始原型,以帮助NOAA科学家使用AI在他们捕获的数百万张图像中找到印章。

汤姆·泰敏(Tom Temin):因此,他们将飞越他们试图数入海豹的领土并取回照片。从我的观察来看,您已经出版了其中的几本,并且您无法分辨伊拉克的印章,因此基本上他们是逐张浏览图片,无法真正准确地计算出印章。这是表征它的公平方法吗?

丹·莫里斯(Dan Morris):对。实际上,甚至比这还糟。如果您想象要飞越阿拉斯加海岸,然后将相机对准地面。不仅很难找到海豹。这些图像中有99.99%中间没有有趣的东西。在大约两百万个图像对上只有水和冰的图像,可以找到一千个海豹。

汤姆·泰敏(Tom Temin):人工智能是如何诞生的?因为,首先,正如您所说,其中没有图片。但是即使在带有印章的照片中,它们也很难从空中发现,因为它们只是黑色斑点。

丹·莫里斯(Dan Morris):对。好吧,NOAA为他们工作的一件事是他们不仅仅是在使用彩色图像。他们还捕获了热图像,并且海豹很冷,但是它们比冰要热得多,因此在这些热图像中海豹更加明显。要真正了解正在发生的事情,您需要同时查看热图像和彩色图像。但是即使在这些热图像中,也有很多其他东西冒出来比冰更热,因此即使在这些热图像中,与冷冰相比,您希望密封件看起来像是一个漂亮的亮点,那里有很多亮点,人工智能给了我们一个机会,让计算机查看所有这些亮点和彩色图像,并试图帮助他们找出哪些是密封。

汤姆·泰敏(Tom Temin):也许计算机最初可以做的事情就是排除所有无关的无关图像。

丹·莫里斯(Dan Morris):对。这可能是我们可以为他们做的最重要的事情,因为在这种情况下,这又是图像的99.99%。因此,尽管也有可能具有潜在的价值,例如,对特定图像中要查看的印章进行分类,但真正的好处和实时节省来自摆脱所有那些空洞而无趣的图像。

汤姆·泰敏(Tom Temin):关于最终确定什么,到底要密封什么。当我想到人工智能时,我想到的是随着训练和学习而不断发展的软件。因此,请告诉我们有关从错误的点中简单识别点的AI方面。

丹·莫里斯(Dan Morris):那就对了。就像大多数AI和机器学习问题一样。真正的秘密是零件算法,但不仅如此,它还拥有一个非常好的数据集,可以告诉机器您想要识别什么以及不需要什么。因此,该项目的第一步是从NOAA获得所有这些图像,这本身并不是一件容易的事,因为它约有20 TB的图像,并获得了一个非常有条理的表格,其中这些图像带有印章,它们在哪里这些没有密封件?至此,我们启动该项目的时刻,NOAA已经审阅并注释了其2016年航班的所有图像。因此,我们拥有了如此惊人的资源,这里有200万张图片,这是几千张带有图章的图片,这正是这些图章在这些图片中的位置,而这恰恰是您需要教给AI模型如何在新图像中找到想要的东西。这就是我们真正开始的地方。