Wat zit er achter de OpenAI-bot die de beste Dota-speler ter wereld verslaat

Vorige week was de geschiedenis aangemaakt in het rijk van Dota 2 en AI. Bij The International, Dendi, een van de beste spelers van het spel, werd genadeloos in een 1v1 verslagen door een bot, twee keer op rij. De bot in kwestie is gemaakt door OpenAI, een startup van Elon Musk.




Nu heb je misschien wat vragen. Wat is Dota? Wat is OpenAI? En waarom is dit zelfs belangrijk? Om te beginnen met, Dota is een gratis te spelen MOBA-game waarin je de controle hebt Heroes en je doel is om de tegenstanders te vernietigen Oude. Veel Dota-fans kunnen aanstoot nemen tot de laatste zin omdat er zoveel te Dota is dan ik heb samengevat.



De game is erg complex met een zeer steile leercurve. Ik was enige tijd geleden begonnen met een missie om Dota te leren en het kostte me een week om een ​​basiscursus te doorlopen Hoe video, waarin ze de strategie van het spel uitleggen, wat wapens, spreuken, helden doen en hoe kruipen te minen. En dit maakt het geheel AI vs Dendi strijd belangrijk omdat het illustreert hoe geavanceerd AI en ML zijn geworden. Dus laten we kijken wat die bot aandrijft en moeten we bang worden voor AI-opstand.





Rise Of The Planet Of The AI

AI Skynet worden is een discutabel probleem. Elon Musk gelooft dat, indien niet onder controle gehouden, skynet zoals scenario waarschijnlijk zal gebeuren. Aan de andere kant, Mark Zuckerbergzegt dat AI onschadelijk is en geen Doomsday Scenario veroorzaakt. Elon Musk startte OpenAI met dit doel.

Om misbruik van AI en onderzoek naar AI te voorkomen dat zich niet tegen ons zal keren. En ik sta aan zijn zijde.

Maar dat is niet waar we het hier over hebben. Het hoofdonderwerp is om te weten wat de motor van de OpenAI aandrijft. Om er een goed begrip van te krijgen, las ik enkele research papers en blogs over het onderwerp en nam ik ook contact op met mijn vriendAnmol Sharma wie is een AI & ML-onderzoeker.

Versterking leren

Dit is de naam van de technologie achter de Dota-bot van de OpenAI. Maar voordat we het gaan verdiepen, moeten we begrijpen hoe algemene AI, of specifiek AI erin staat Computerspelletjes werk. AI is een zeer boardterm en bevat veel onderwerpen zoals Machine Learning, Deep Learning en Neural Networks om er maar een paar te noemen. Om AI grof te definiëren, kunnen we zeggen dat een computer het vermogen heeft om van informatie te leren en beslissingen te nemen op basis van zijn kennis. Hoe meer het leert, hoe meer de correctheid van beslissingen toeneemt.

Waarin verschilt het van normale bot's?

Bots in algemene videogames zien er misschien intelligent uit, maar het is geen echte vorm van AI. Bijna al deze bots in games zijn geprogrammeerd op basis van set If..This..Then..That statements. Ze volgen gewoon de verklaringen en ondernemen actie op basis van de voorwaarden in de verklaring.

Een voorbeeld van een If..Else .. verklaring voor een AI-bot

Hierboven heb ik een heel eenvoudig voorbeeld laten zien. Uitspraken in echte spellen zijn veel complexer met voorwaarden binnen voorwaarden. Hoe beter gedefinieerd en gedetailleerd deze uitspraken zijn, hoe meer de bot intelligent lijkt te zijn.





Beloningen en straffen

In AI-lingo staat wat we bot noemen een agent. Het doel is om de agent te laten leren wat we willen dat hij leert. De agent leert op dezelfde manier als uw hond leert, via beloningen en straffen. Wanneer de agent een fout maakt, wordt hij bestraft en telkens wanneer hij de juiste gok doet of het juiste antwoord geeft, wordt hij beloond. Via dit systeem leert de agent de acties te associëren die hij niet zou moeten doen om straf te vermijden en de actie (of soortgelijke acties) uit te voeren die beloningen opleveren.

Een algoritme is de ruggengraat van AI

Als je er goed over nadenkt, is het net alsof je beslissingen neemt op basis van bepaalde voorwaarden, net zoals algoritmen het doen. Zoals ik hierboven heb aangetoond, zal een game-bot, die een explosief vat tegenkomt, acties ondernemen volgens het algoritme. Algoritmen in AI zijn uiteraard enorm complex dan dit, wat het hele systeem maakt intelligent.

Komt naar onze OpenAI-bot, volgens de ontwikkelaars, het leerde het hele spel in de tijd van 2 weken. Gedurende de hele tijd van 2 weken was het 24 × 7 online en speelde het tegen een kopie van zichzelf. Dat is een opmerkelijke mijlpaal gezien de complexiteit van het spel en het feit dat het kon verslaan Dendi.





Waarom zijn er nog geen auto's zonder bestuurder?

Dit was een van de eerste vragen die in me opkwam toen ik over dit hele evenement hoorde. Als een bot zo'n spel kan leren en zichzelf kan trainen om topspelers te verslaan, waarom bemannen we dan nog steeds het wiel? En dit was dezelfde vraag die ik op mijn vriend schoot, NRK Anmol Sharma, die ook onderzoek heeft gedaan naar rijloze auto's. Dit is wat hij te zeggen had.

In een spel dat door een mens is ontwikkeld, is het aantal variabelen minder. Bovendien, als de agent (bot) een fout maakt, is de ergste straf een rond verlies. In de echte wereld is een fout de dood.

Hoewel Dota een complexe game is, zijn de mogelijke combinaties van bewegingen, spreuken en tactieken, hoewel nog steeds absurd groot, nog steeds beperkt. En fouten zijn toegestaan ​​zonder echte straf. Maar in het geval van een auto-agent zonder bestuurder, kunnen fouten leiden tot gevaarlijke ongevallen en zelfs de dood.

Waymo's nieuwe autonome auto voor 2017

In de echte wereld is het aantal variabelen dat de agent moet controleren eindeloos en zijn er situaties die zich voordoen als gevolg van deze variabelen, zoals een andere auto die plotseling van rijstrook verandert, voetgangers springen voor de auto, ook eindeloos. Plus, als Jeremy Clarksonmet andere woorden, ze zullen morele en ethische beslissingen moeten nemen wanneer ze aan de vooravond staan ​​van een onmiddellijk ongeluk (hoewel zijn theorie niet geldig is).





De toekomst

We weten al dat door de mens bestuurde robot intrinsieke operaties uitvoert. De volgende sprong is AI-bestuurde robots die het uitvoeren. En dit is alleen op medisch gebied. AI zal in veel gebieden de komende tien jaar zeker de dominante nieuwe technologie zijn. Maar AI kan ook worden misbruikt voor snode doeleinden zoals DDoS aanvallen, ransomware Bots en hacking van andere pc's of systemen van bedrijven.

De laatste openbare interactie van een bot verliep niet zo soepel

Wat Dota en andere spellen betreft, kunnen we verwachten dat dergelijke intelligente bots ook worden gemaakt voor andere spellen, tegen wie spelers kunnen trainen om nog beter te presteren. En had ik al gezegd dat OpenAI volgend jaar een 5v5 gaat doen op International? Dus ik ga mijn Dota-vaardigheden opfrissen om op zijn minst de ingebouwde dumber bots te verslaan. Goddelijke Rapier hier kom ik!