گوگل مجموعه گستردهای از مدلها و APIهای هوش مصنوعی پیشرو در صنعت را برای استنتاج مبتنی بر ابر و روی دستگاه ارائه میدهد. استنتاج ترکیبی به شما امکان میدهد تا به طور یکپارچه حجم کار هوش مصنوعی را بین دستگاه محلی و ابر متعادل کنید و عملکرد، هزینه و در دسترس بودن را بهینه کنید.
استنتاج ترکیبی دو مزیت اصلی برای برنامه اندروید شما فراهم میکند:
- حداکثر دسترسی : مدلهای ابری به عنوان یک جایگزین حیاتی عمل میکنند، زمانی که مدلهای روی دستگاه، مانند Gemini Nano، به دلیل محدودیتهای سختافزاری دستگاه یا سیستمعامل در دسترس نیستند. این امر به تضمین عملکرد صحیح ویژگیهای هوش مصنوعی شما در طیف وسیعی از دستگاههای کاربر کمک میکند.
- هزینه و قابلیتهای آفلاین : مدلهای روی دستگاه به شما اطمینان میدهند که ویژگیهای هوش مصنوعی شما حتی زمانی که کاربر آفلاین است، به طور یکپارچه کار میکنند. علاوه بر این، انتقال وظایف روتین به دستگاه محلی به کاهش هزینههای استنتاج ابری کمک میکند.
در اینجا به ترتیب مزایای استنتاج روی دستگاه و استنتاج ابری آورده شده است:
| استنتاج روی دستگاه | استنتاج ابری |
|---|---|
| آفلاین موجود است | سازگار با هر دستگاهی |
| بدون هزینه استنتاج | قابلیتهای پیشرفته مدل |
گزینههای پیادهسازی
شما میتوانید استنتاج ترکیبی را با استفاده از رویکردهای زیر پیادهسازی کنید:
رابط برنامهنویسی ترکیبی فایربیس هوش مصنوعی و منطق
رابط برنامهنویسی کاربردی ترکیبی Firebase AI Logic، یک رابط کاربری واحد و یکپارچه برای تقسیم استنتاج بین محیطهای ابری و روی دستگاه فراهم میکند.
این شامل یک پارامتر onDeviceConfig است که کنترلهای سادهای را برای تعریف حالت استنتاج و مدیریت مسیریابی ارائه میدهد:
-
PREFER_ON_DEVICE: تلاش میکند از مدل روی دستگاه استفاده کند و اگر مدل روی دستگاه برای درخواست در دسترس نباشد یا پشتیبانی نشود، به طور خودکار به مدل میزبانی ابری برمیگردد. -
PREFER_IN_CLOUD: تلاش میکند تا زمانی که دستگاه آنلاین است و مدل در دسترس است، از مدل میزبانی ابری استفاده کند و تنها در صورتی که دستگاه آفلاین باشد، به مدل روی دستگاه برمیگردد. -
ONLY_ON_DEVICE: تلاش میکند از مدل روی دستگاه استفاده کند، اما اگر برای درخواست در دسترس نباشد یا پشتیبانی نشود، یک استثنا ایجاد میکند. -
ONLY_IN_CLOUD: تلاش میکند تا زمانی که دستگاه آنلاین است و مدل در دسترس است، از مدل میزبانی ابری استفاده کند و در سایر موارد استثنا ایجاد میکند.
val model = Firebase.ai(backend = GenerativeBackend.Companion.googleAI()) .generativeModel( modelName = "gemini-2.5-flash", onDeviceConfig = OnDeviceConfig(mode = InferenceMode.Companion.PREFER_ON_DEVICE) ) val response = model.generateContent("Write a story about a green robot.") print(response.text)
برای جزئیات پیادهسازی، مستندات Firebase را مرور کنید و نمونه Hybrid AI را در کاتالوگ AI بررسی کنید.
مسیریابی سفارشی
اگر برنامه شما الزامات تجاری یا UX خاصی دارد، میتوانید منطق مسیریابی سفارشی را نیز پیادهسازی کنید. این به شما امکان میدهد مسیر استنتاج را به صورت پویا بر اساس عوامل بلادرنگ، مانند موارد زیر، تعیین کنید:
- تأخیر شبکه
- سلامت سیستم دستگاه (به عنوان مثال سطح باتری و بار پردازنده)
- پیچیدگی پرس و جوی کاربر
این رویکرد استنتاج ترکیبی سفارشی توسط برنامههای پیشرو که مسیریابی سفارشی خود را برای ارائه تجربیات هوش مصنوعی قابل اعتماد پیادهسازی کردهاند، استفاده میشود، از جمله:
GBoard : جیبورد از استنتاج ترکیبی سفارشی برای تقویت ابزارهای نوشتاری مانند ویرایش و بازنویسی استفاده میکند.
کاکائو موبیلیتی : کاکائو موبیلیتی با استفاده از استنتاج ترکیبی سفارشی، ابزاری برای استخراج موجودیتها برای سرویس تحویل بسته خود ساخته است که به طور خودکار نام، آدرس و شماره تلفن گیرنده را از پیامهای زبان طبیعی استخراج میکند تا فرمهای سفارش را سادهسازی کند.