چرا Node.js خیلی سریع است؟
منظور از «زمان پاسخگویی» چیست؟
وقتی در مورد وب سرویسها(Web Services) حرف میزنیم، «زمان پاسخگویی» شامل برایند همه زمانهایی است که برای پردازش یک درخواست(Request) و فرستادن پاسخ(Response) به یک Client نیاز است. تعریف من از «زمان پاسخگویی» این است: مقدار زمانی که برای پردازش یک درخواست(Request)، از زمان باز شدن ارتباط(Connection) از سوی Client تا در دریافت پاسخ(Response) آن درخواست، صرف می شود.
به محض اینکه بفهمید هنگام پردازش یک درخواست(Request) در یک سرور Node.js چه اتفاقی می افتد، دلیل سریع بودن آن را در مییابید. اما قبل از اینکه در مورد Node.js صحبت کنیم، بیایید به پردازش درخواستها(Requests) در دیگر زبانها(تکنولوژی ها) نگاه کنیم. به توجه به آشنایی اکثر توسعه دهندهها با زبان php پلتفرم Node.js را با سکوی PHP مقایسه میکنیم. اکثر Benchmark ها نشان داده که Node.js در پردازش درخواستها نسبت به PHP سریعتر است. اینجا به دلایلی که در PHP «زمان پاسخگویی» طولانیتر است اشاره میکنیم.
دلایل بالا بودن زمان پاسخگویی در PHP
- ابتدا اینکه PHP یک زبان synchronous است. این یعنی وقتی که شما یک درخواست(Request) را در این زبان پردازش(Processing) میکنید -مثلا نوشتن در یک پایگاه داده(Database)- همه عملکردهای دیگر متوقف میشود تا این کار تمام شود، شما مجبورید منتظر بمانید تا این کار تمام شود و هیچ کار دیگری قابل انجام نیست.
- هر درخواستی(Request) که به وب سرویس(Web Service) میفرستید در سرور یک Process(در بعضی موارد به جای یک Process وب سرویس یک Thread ایجاد میکند) جداگانه مفسر PHP ایجاد می کند که کد شما را اجرا کند. اگر هزار Connection داشته باشید هزار Process در حال اجرا خواهید داشت که رم(Ram) میخورند :).
- سکوی PHP در حالت پیشفرض فاقد« JIT compilation» – کامپایل کد در زمان اجرا- می باشد(البته در ماشین مجازی HHVM که برای اجرای کدهای PHP و Hack ساخته شده است مفهوم JIT پیاده سازی شده است.)، کامپایل کد در زمان اجرا هنگامی که کدی دارید که به دفعات اجرا می شود خیلی مهم است، زیرا شما معمولا دوست دارید، برای بازدهی بیشتر، مطمئن شوید که این کد تقریبا از نظر زمان اجرا نزدیک به کد نوشته شده به زبان ماشین عمل کند.
حال بیاید ببینیم Node.js چگونه این مشکلات را مدیریت و حل میکند.
دلایل پایین بودن زمان پاسخگویی در Node.js
- سکوی Node.js یک پلتفرم single-threaded و asynchronous است. هیچ کدام از عملکردهای مرتبط با I/O بقیه عملکردها را متوقف نمیکند. این به معنای آن است که شما میتوانید در یک زمان هم از روی دیسک یک فایل را بخوانید هم یک ایمیل بفرستید و هم بر روی پایگاه داده Query بزنید.
- هر کدام از درخواست هایی(Request) که به وب سرویس(Web Service) می رسند یک Process جدید Node.js ایجاد نمی کنند، به جای آن در اغلب اوقات فقط و فقط یک Process مربوط به Node.js در حال اجرا است که به ارتباطات(Connections) و درخواستها(Requests) گوش می دهد. کدهای جاوااسکریپت در Thread اصلی و عملکردهای مرتبط با I/O در Thread های دیگری اجرا میشوند.
- ماشین مجازی(Google V8) در Node.js که کدهای جاوااسکریپت را اجرا می کند دارای ویژگی کامپایل در زمان اجرا(JIT Compilation) می باشد. وقتی این ماشین مجازی کدهای جاوااسکریپت را میگیرد در زمان اجرا آنها را به کدهایی نزدیک به کدهای زبان ماشین کامپایل میکند، این کار باعث میشود توابعی که به دفعات صدا زده میشوند با تبدیل شدن به کدهای شبیه کد ماشین به طور قابل ملاحظهای سرعت اجرای کدها را بهبود دهد.
حال که مزیتهای مفهوم asynchronous در Node.js را دیدیم اجازه دهید برایتان توضیح دهم که این مفهوم در Node.js چگونه کار میکنند.
در مسیر شناخت مفهوم asynchronous
مفهوم پردازش asynchronous را می خواهم در قالب مثال برایتان بیان میکنم.
فرض کنید در بالای یک کوه ۱۰۰۰ توپ در اختیار شماست، شما باید همه این توپها را به پایین کوه بیاورید(هل دهید).قاعدتا شما نمی توانید همه این توپها را در یک زمان به پایین بفرستید، شما احتمالا مجبور خواهید بود توپها را تک تک به پایین بفرستید اماخب این به معنای آن نیست که باید منتظر بمانید تا یک توپ به پایین کوه برسد تا توپ بعدی را بفرستید.
در این مثال رویکرد synchronous به این معنا است که شما باید منتظر باشید که یک توپ به پایین برسد تا توپ بعدی را بفرستید، واقعا زمان زیادی میبرد، درسته؟
رویکرد Asynchronous در مثال بالا یعنی همه توپها را به سرعت پشت سر هم رها کنید سپس صبر کنید تا هر کدام به پایین برسند(مثل اینکه Notification دریافت کنید).
خب سوال اصلی این است که این(رویکرد Asynchronous) چگونه به بهبود کارایی یک وب سرویس یا وب سرور کمک میکند؟
بیایید در نظر بگیریم هر توپ یک Query در پایگاه داده است. شما یک پروژه بزرگ دارید با تعداد زیادی aggregations، Query و … وقتی شما همه چیز را با رویکرد synchronous پردازش و مدیریت میکنید هر کدام از این کارها باعث متوقف شدن اجرای کد میشود. وقتی با رویکرد asynchronous همه چیز را پردازش و مدیریت میکنید شما میتوانید همه کارها را یکدفعهای انجام دهید و سپس نتیجهها را وصول کنید.
در دنیای واقعی، وقتی شما تعداد زیادی ارتباط(Connections) داشته باشید، این رویکرد -asynchronous- به طور قابل ملاحظهای کارایی و عملکرد برنامه شما را بهبود میبخشد.
مفهوم asynchronous چگونه در Node.js پیاده سازی شده است؟
Event loop
Event loop یک ساختار است که مسئول مخابره(dispatch) کردن رویدادها(Events) در یک برنامه است که تقریبا همیشه با سازنده پیام(Message) بصورت asynchronous رفتار میکند. وقتی شما یک عملکرد مرتبط با I/O را صدا میزنید Node.js یک Callback را به این عملکرد متصل میکند و به پردازش کد ادامه میدهد. وقتی همه اطلاعات لازم مرتبط با عملکردی که یک Callback به آن ملحق شد جمع آوری شد، Node.js آن Callback را اجرا میکند.
تعریف دقیقتر Event Loop از ویکی پدیا در زیر آماده است:
The event loop, message dispatcher, message loop, message pump, or run loop is a programming construct that waits for and dispatches events or messages in a program. It works by making a request to some internal or external “event provider” (which generally blocks the request until an event has arrived), and then it calls the relevant event handler(“dispatches the event”). The event-loop may be used in conjunction with a reactor, if the event provider follows the file interface, which can be selected or ‘polled’ (the Unix system call, not actual polling). The event loop almost always operates asynchronously with the message originator.
بیایید به این تصویر ساده که شیوه کارکرد Event Loop را تشریح میکند نگاه بیاندازیم.
وقتی یک درخواست توسط وب سرور دریافت میشود این درخواست وارد Event Loop میشود، Event Loop این عملیات را به Thread Pool تحویل میدهد و برای آن یک Callback مشخص میکند، این Callback زمانی اجرا میشود که درخواست پردازش و آماده گردد. این Callback میتواند درون خود دیگر عملیات سنگین مانند Query زدن در پایگاه داده را داشته باشد که هر کدام از این عملیاتها دقیقا مانند پردازش یک درخواست با آنها رفتار میشود. یعنی هر کدام از عملیات پیچیده تحویل Thread Pool میشود و …
اما اجرای کد چگونه انجام میشود، خوب در بخش بعدی این مقاله ما در مورد ماشین مجازی که کدهای جاوااسکریپت را اجرا میکند صحبت میکنیم. در مورد موتور V8.
چگونه V8 کدهای شما را بهینه میکند که به سرعت اجرا شوند!؟
من میخواهم در مورد مفاهیم پایه V8 صحبت کنم و اینکه این موتو چگونه کدهای جاوااسکریپت را برای اجرا شدن بهینه سازی میکند، با توجه با این که این مفاهیم به شدت پیچیده و فنی هستند بنابراین میتوانید با خیال راحت این مفاهیم را نخوانید :)، برای آشنایی بیشتر با V8 می توانید منابع V8 را ببینید.
موتور V8 دارای دو نوع کامپایلر است(البته در واقع سومین کامپایلر با نام Turbofan در حال توسعه است) کامپایلر «Full» و کامپایلر «Crankshaft»
کامپایلر Full بسیار سریع است و وظیفه اش تولید کد generic است. این کامپایلر ابتدا یک AST یا Abstract Syntax Tree از توابع جاوااسکریپت تولید می کند و آن را به کد پایه ماشین ترجمه می کند. در این مرحله فقط یک بهبود رخ میدهد این بهبود Inline Caching نام دارد.
وقتی تابع کامپایل میشود و کد در حال اجراست، V8 یک Thread پیشفیلتر(Profiler) را آغاز میکند که بفهمد کدام تابع به اصطلاح Hot است (Hot به معنای توابعی است که زیاد صدا زده میشود) و کدام نیست.
وقتی V8 توابع Hot را تشخیص داد، کد AST مربوط به آن را از طریق کامپایلر Crankshaft اجرا می کند.
کامپایلر Crankshaft خیلی سریع نیست بلکه بیشتر سعی می کند کد بهبودیافته و سریع تولید کند، این کامپایلر از دو بخش تولید شده است، هیدروژن و لیتیم
هیدروژن CFG – Control Flow Graph را با استفاده از AST تولید میکند. این گراف بصورت SSA – Static Single Assignment نمایان میشود. بسته به ساختار ساده HIR – High-Level Intermediate Representation و فرم نمایشی SSA کامپایلر می تواند تعداد زیادی بهبود را اعمال کند، بهبودهایی مانند constant folding و method inlining و …
کامپایلر لیتیوم HIR بهبود یافه را به LIR – Low-Level Intermediate Representation تبدیل میکند. LIR اساسا بسیار به کد ماشین شبیه است، البته هنوز کاملا واببسته به پلتفرم است در مقام مقایسه با HIR ساختار LIR به three-address code نزدیک تر است.
این روند در نهایت همیشه کد بهبود یافته را با کد کند تر جایگزین میکند. و این چنین به اجرای کد شما بصورت سریعتر ادامه مییابد.