استنتاج ترکیبی

گوگل مجموعه گسترده‌ای از مدل‌ها و APIهای هوش مصنوعی پیشرو در صنعت را برای استنتاج مبتنی بر ابر و روی دستگاه ارائه می‌دهد. استنتاج ترکیبی به شما امکان می‌دهد تا به طور یکپارچه حجم کار هوش مصنوعی را بین دستگاه محلی و ابر متعادل کنید و عملکرد، هزینه و در دسترس بودن را بهینه کنید.

استنتاج ترکیبی دو مزیت اصلی برای برنامه اندروید شما فراهم می‌کند:

  • حداکثر دسترسی : مدل‌های ابری به عنوان یک جایگزین حیاتی عمل می‌کنند، زمانی که مدل‌های روی دستگاه، مانند Gemini Nano، به دلیل محدودیت‌های سخت‌افزاری دستگاه یا سیستم‌عامل در دسترس نیستند. این امر به تضمین عملکرد صحیح ویژگی‌های هوش مصنوعی شما در طیف وسیعی از دستگاه‌های کاربر کمک می‌کند.
  • هزینه و قابلیت‌های آفلاین : مدل‌های روی دستگاه به شما اطمینان می‌دهند که ویژگی‌های هوش مصنوعی شما حتی زمانی که کاربر آفلاین است، به طور یکپارچه کار می‌کنند. علاوه بر این، انتقال وظایف روتین به دستگاه محلی به کاهش هزینه‌های استنتاج ابری کمک می‌کند.

در اینجا به ترتیب مزایای استنتاج روی دستگاه و استنتاج ابری آورده شده است:

استنتاج روی دستگاه استنتاج ابری
آفلاین موجود است سازگار با هر دستگاهی
بدون هزینه استنتاج قابلیت‌های پیشرفته مدل

گزینه‌های پیاده‌سازی

شما می‌توانید استنتاج ترکیبی را با استفاده از رویکردهای زیر پیاده‌سازی کنید:

رابط برنامه‌نویسی ترکیبی فایربیس هوش مصنوعی و منطق

رابط برنامه‌نویسی کاربردی ترکیبی Firebase AI Logic، یک رابط کاربری واحد و یکپارچه برای تقسیم استنتاج بین محیط‌های ابری و روی دستگاه فراهم می‌کند.

این شامل یک پارامتر onDeviceConfig است که کنترل‌های ساده‌ای را برای تعریف حالت استنتاج و مدیریت مسیریابی ارائه می‌دهد:

  • PREFER_ON_DEVICE : تلاش می‌کند از مدل روی دستگاه استفاده کند و اگر مدل روی دستگاه برای درخواست در دسترس نباشد یا پشتیبانی نشود، به طور خودکار به مدل میزبانی ابری برمی‌گردد.
  • PREFER_IN_CLOUD : تلاش می‌کند تا زمانی که دستگاه آنلاین است و مدل در دسترس است، از مدل میزبانی ابری استفاده کند و تنها در صورتی که دستگاه آفلاین باشد، به مدل روی دستگاه برمی‌گردد.
  • ONLY_ON_DEVICE : تلاش می‌کند از مدل روی دستگاه استفاده کند، اما اگر برای درخواست در دسترس نباشد یا پشتیبانی نشود، یک استثنا ایجاد می‌کند.
  • ONLY_IN_CLOUD : تلاش می‌کند تا زمانی که دستگاه آنلاین است و مدل در دسترس است، از مدل میزبانی ابری استفاده کند و در سایر موارد استثنا ایجاد می‌کند.

val model = Firebase.ai(backend = GenerativeBackend.Companion.googleAI())
    .generativeModel(
        modelName = "gemini-2.5-flash",
        onDeviceConfig = OnDeviceConfig(mode = InferenceMode.Companion.PREFER_ON_DEVICE)
    )

val response = model.generateContent("Write a story about a green robot.")
print(response.text)

برای جزئیات پیاده‌سازی، مستندات Firebase را مرور کنید و نمونه Hybrid AI را در کاتالوگ AI بررسی کنید.

مسیریابی سفارشی

اگر برنامه شما الزامات تجاری یا UX خاصی دارد، می‌توانید منطق مسیریابی سفارشی را نیز پیاده‌سازی کنید. این به شما امکان می‌دهد مسیر استنتاج را به صورت پویا بر اساس عوامل بلادرنگ، مانند موارد زیر، تعیین کنید:

  • تأخیر شبکه
  • سلامت سیستم دستگاه (به عنوان مثال سطح باتری و بار پردازنده)
  • پیچیدگی پرس و جوی کاربر

این رویکرد استنتاج ترکیبی سفارشی توسط برنامه‌های پیشرو که مسیریابی سفارشی خود را برای ارائه تجربیات هوش مصنوعی قابل اعتماد پیاده‌سازی کرده‌اند، استفاده می‌شود، از جمله:

  • GBoard : جی‌بورد از استنتاج ترکیبی سفارشی برای تقویت ابزارهای نوشتاری مانند ویرایش و بازنویسی استفاده می‌کند.

  • کاکائو موبیلیتی : کاکائو موبیلیتی با استفاده از استنتاج ترکیبی سفارشی، ابزاری برای استخراج موجودیت‌ها برای سرویس تحویل بسته خود ساخته است که به طور خودکار نام، آدرس و شماره تلفن گیرنده را از پیام‌های زبان طبیعی استخراج می‌کند تا فرم‌های سفارش را ساده‌سازی کند.