1. بهذا الاسلوب ما هو مقدار الContext المخصص للمستخدم من الContext الكمل للنموذج اي ان بعض النماذج تمتلك Context بحجم 250k token كم منها سيكون مخصص للمحادثة و هل سوف يشكل مشكلة في تجربة المستخدم مثل ان يفقد النموذج السياق بعد خمس اسئلة مثلا ؟
2. هل النظام سيكون بطيء بسبب تعقيد العمليات في الخلفية و ماذا افعل لجعل تجربة المستخدم اكثر سلاسة ؟