स्केल एआई का 7.3 बिलियन डॉलर की कंपनी बनने का मार्ग छवियों, टेक्स्ट, वॉयस और वीडियो के वास्तविक डेटा में प्रशस्त हुआ। अब, यह उस नींव का उपयोग सिंथेटिक डेटा गेम में करने के लिए कर रहा है, जो एआई में सबसे गर्म और उभरती श्रेणियों में से एक है।
उन्होंने बुधवार को एक अर्ली एक्सेस प्रोग्राम की घोषणा की स्केल सिंथेटिक, एक उत्पाद जिसे मशीन लर्निंग इंजीनियर कंपनी के अनुसार अपने मौजूदा वास्तविक-विश्व डेटा सेट को बढ़ाने के लिए उपयोग कर सकते हैं। स्केल ने अपने व्यवसाय के इस नए प्रभाग को बनाने के लिए दो अधिकारियों को काम पर रखा। स्केल ने जोएल क्रोनेंडर को काम पर रखा, जो पहले नाइन में मशीन लर्निंग का नेतृत्व करते थे और एप्पल में एक पूर्व कंप्यूटर विज़न इंजीनियर थे, जो सिंथेटिक डेटा के अपने नए प्रमुख के रूप में 3 डी मैपिंग पर काम कर रहे थे। कंपनी ने विवेक राजू मुपल्ला को सिंथेटिक सेवाओं के निदेशक के रूप में भी काम पर रखा है। मुपल्ला पहले यूनिटी टेक्नोलॉजीज में एआई और सिमुलेशन के लिए इंजीनियरिंग के निदेशक थे।
सिंथेटिक डेटा वैसा ही है जैसा यह लगता है: नकली डेटा जो वास्तविक दुनिया की जानकारी का उपयोग करने के बजाय मशीन लर्निंग एल्गोरिदम द्वारा बनाया गया है। यह डेटा उत्पन्न करने के लिए एक शक्तिशाली और आसान उपकरण हो सकता है – जैसे मेडिकल इमेजिंग – जब गोपनीयता एक शीर्ष चिंता का विषय है। डेवलपर अपने प्रशिक्षण मॉडल में अधिक जटिलता जोड़ने के लिए सिंथेटिक डेटा का उपयोग कर सकते हैं और उन पूर्वाग्रहों को दूर करने में मदद कर सकते हैं जो अक्सर एकत्रित वास्तविक-विश्व डेटा सेट में पाए जा सकते हैं।
संस्थापक और सीईओ एलेक्जेंडर वैंग ने अपनी नई पेशकश को डेटा के लिए एक हाइब्रिड दृष्टिकोण के रूप में वर्णित किया, जो प्रयोगशाला में उगाए गए मांस के समान है।
“हम वास्तविक डेटा के साथ शुरू करते हैं, ठीक उसी तरह जैसे लैब में उगाया गया मांस वास्तविक जानवरों की कोशिकाओं से शुरू होता है, और फिर बढ़ता है और फिर से उत्पाद का निर्माण करता है,” उन्होंने टेकक्रंच को बताया। सिंथेटिक डेटा बनाने के लिए आधार के रूप में वास्तविक दुनिया के डेटा का उपयोग करके, कंपनी ग्राहकों के लिए वास्तव में एक अनूठी और शक्तिशाली पेशकश की पेशकश करने में सक्षम है, वांग ने कहा, यह एक अंतर था जिसे उन्होंने बाजार में देखा था।
स्केल ग्राहकों ने उस अंतर को भी देखा। सिंथेटिक डेटा में कंपनी का धक्का अपने ग्राहकों की मांग के जवाब में था, वांग ने टेकक्रंच को बताया, जिन्होंने कहा कि उन्होंने एक साल से भी कम समय पहले उत्पाद का निर्माण शुरू किया था। वांग ने कहा कि स्वायत्त वाहन प्रौद्योगिकी डेवलपर कोडिएक रोबोटिक्स, ट्रैक्टेबल एआई और अमेरिकी रक्षा विभाग ने अपने नए सिंथेटिक डेटा उत्पाद के लिए स्केल का दोहन किया है।
स्केल, जो आज लगभग 450 कर्मचारियों को रोजगार देता है, 2022 में सिंथेटिक डेटा को सर्वोच्च प्राथमिकता के रूप में देखता है, और एक ऐसा क्षेत्र जिसमें वह अपनी उत्पाद लाइन का निर्माण करते हुए निवेश करना जारी रखेगा। लेकिन इसका मतलब यह नहीं है कि यह अपने वास्तविक डेटा व्यवसाय को संभाल लेगा। वांग सिंथेटिक डेटा को एक पूरक उपकरण के रूप में देखता है जो डेवलपर्स को “उनके एल्गोरिदम और अन्य एआई और विशेष रूप से किनारे के मामलों के साथ अपने पैसे के लिए अधिक धमाकेदार मदद करेगा।
उदाहरण के लिए, स्वायत्त वाहन कंपनियां आमतौर पर वास्तविक दुनिया से परिदृश्यों को फिर से बनाने के लिए सिमुलेशन का उपयोग करती हैं और यह देखने के लिए इसे वापस चलाती हैं कि स्वायत्त प्रणाली इसे कैसे संभालेगी। लेकिन हो सकता है कि वास्तविक दुनिया का डेटा वह परिदृश्य प्रदान न करे जिसकी वे तलाश कर रहे हैं।
वांग ने समझाया, “आप वास्तविक दुनिया में परिदृश्यों में अक्सर भाग नहीं लेते हैं, जहां 100 साइकिल चालक एक बार में पार कर सकते हैं।” “हम वास्तविक दुनिया के डेटा से शुरू कर सकते हैं और फिर कृत्रिम रूप से सभी साइकिल चालकों या सभी लोगों को जोड़ सकते हैं और फिर इस तरह, आप एल्गोरिदम को ठीक से प्रशिक्षित कर सकते हैं।”