1AITechCrunch AI
АНУ ASML-ийн дэвшилтэт чипийн төхөөрөмж Хятадад байж магадгүй гэв, ASML үгүйсгэлээ
АНУ-ын тал ASML-ийн хамгийн дэвшилтэт чип үйлдвэрлэлийн төхөөрөмж Хятадад очсон байж болзошгүй гэж үзэж байгаа бол ASML үүнийг үгүйсгэж байна. AI чипийн нийлүүлэлтийн сүлжээ, экспортын хяналт улам улс төрийн өндөр эрсдэлтэй талбар болж байгааг энэ маргаан дахин харууллаа.
Дэлгэрэнгүй унших
ASML бол хамгийн нарийн чип үйлдвэрлэх литографийн төхөөрөмжөөр бараг орлуулшгүй байр суурьтай компани. Тиймээс түүний технологи хаашаа, ямар хэрэглэгчид хүрч байгаа нь АНУ, Европ, Хятад гурвын технологийн бодлогын гол зангилаа хэвээр байна.
Монголын уншигчдад энэ нь шууд хэрэглээний мэдээ биш ч AI сервер, GPU, дата төвийн өртөг яагаад өндөр хэвээр байгааг ойлгоход хэрэгтэй. Дараагийн анхаарах зүйл нь АНУ-ын экспортын хяналт улам чангарах эсэх, ASML болон түүний хэрэглэгчдийн тайлбар хэрхэн өөрчлөгдөх вэ гэдэг байна.
Эх сурвалж: The US says ASML’s top chip tool may be in China. ASML says it isn’t2StartupsTechCrunch AI
Baseten inference-ийн “алтны халуурал” дунд $1.5 тэрбум татахаар яригдаж байна
AI inference платформ Baseten хэдхэн сарын өмнөх том санхүүжилтийнхээ дараа дахин $1.5 тэрбум босгохоор хэлэлцэж, үнэлгээ нь $13 тэрбумд хүрч магадгүй гэж мэдээлэв. AI модель сургахаас гадна түүнийг хурдан, хямд ажиллуулах дэд бүтэц хөрөнгө оруулагчдын шинэ гол сэдэв болж байна.
Дэлгэрэнгүй унших
Inference гэдэг нь AI загварыг бодит хэрэглэгчийн хүсэлтэд хариулуулах үе шат. Enterprise хэрэглээ өсөх тусам latency, GPU ашиглалт, нэг хүсэлтийн өртөг зэрэг нь бизнесийн бодит зардал болж хувирч байна.
Энэ чиглэлд мөнгө их орж байгаа нь OpenAI, Anthropic зэрэг моделийн компаниудаас гадна “моделийг ажиллуулах” давхарга өөрөө том зах зээл болж байгааг харуулна. Харин үнэлгээ хэт хурдан өсөхөд бодит орлого, gross margin, cloud provider-уудаас хамаарах хамаарлыг анхаарах хэрэгтэй.
Эх сурвалж: AI inference startup Baseten reportedly raising $1.5B months after its last mega-round3AIOpenAI News
OpenAI ChatGPT Enterprise-д зардлын хяналт, хэрэглээний аналитик нэмлээ
OpenAI ChatGPT Enterprise хэрэглэгчдэд зориулж хэрэглээний аналитик, зарцуулалтын хязгаарлалтын шинэ боломжууд танилцууллаа. AI хэрэгслийг байгууллагын хэмжээнд нэвтрүүлэхэд “хэн юу ашиглаж байна, хэдэн төгрөг болж байна” гэдэг асуулт улам чухал болж байна.
Дэлгэрэнгүй унших
AI subscription анхандаа жижиг багийн туршилт мэт эхэлдэг ч байгууллагын хэмжээнд олон хэлтэс ашиглаад эхлэхээр төсөв хурдан өсдөг. Тиймээс usage dashboard, spending cap, admin policy зэрэг нь enterprise худалдан авалтын үндсэн шаардлага болж байна.
Монголын компаниуд AI хэрэгсэл туршихдаа зөвхөн сарын төлбөрийг биш, хэрэглээний өсөлт, өгөгдлийн бодлого, хэн ямар эрхтэй ашиглахыг хамтад нь тооцох хэрэгтэй. Дараагийн чухал дохио нь бусад AI платформууд ижил түвшний FinOps хэрэгсэл гаргах эсэх юм.
Эх сурвалж: New usage analytics and updated spend controls for enterprises4Dev ToolsAWS News Blog
AWS Blackwell GPU-тэй EC2 G7 instance-уудыг нээлээ
AWS NVIDIA RTX PRO 4500 Blackwell Server Edition GPU-ээр хурдасгасан Amazon EC2 G7 instance-уудыг нийтэд ашиглах боломжтой болголоо. AI inference, graphics, data analytics зэрэг GPU шаардсан ачаалалд зориулсан шинэ сонголт нэмэгдэж байна.
Дэлгэрэнгүй унших
Cloud GPU-ийн сонголт өргөжих нь AI бүтээгдэхүүн хөгжүүлж буй багуудад чухал. Сургалт хийхээс илүү inference, визуал тооцоолол, дата шинжилгээ зэрэг ажлыг зөв instance дээр ажиллуулах нь зардал ба хурдын том ялгаа гаргана.
AWS-ийн энэ алхам cloud provider-ууд Blackwell үеийн GPU-г бүтээгдэхүүн болгох уралдаанд орсныг харуулж байна. Хэрэглэгчид benchmark, бүсийн боломж, үнэ, autoscaling-ийн бодит гүйцэтгэлийг харж байж шилжилт хийх нь зүйтэй.
Эх сурвалж: Announcing Amazon EC2 G7 instances accelerated by NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs5CybersecurityArs Technica
Microsoft крипто хулгайлах шинэ хөнгөн backdoor илрүүлжээ
Microsoft USB-ээр тархаж, Tor-оор харилцдаг Crypto Clipper нэртэй шинэ malware илрүүлсэн талаар Ars Technica мэдээлэв. Крипто хэрэглэгчид болон байгууллагууд clipboard, wallet address, USB төхөөрөмжийн эрсдэлээ дахин шалгах шаардлагатай болж байна.
Дэлгэрэнгүй унших
Ийм төрлийн malware ихэвчлэн хэрэглэгчийн хуулсан крипто хаягийг өөр хаягаар солих, эсвэл backdoor нээж өгөгдөл хулгайлах замаар ажилладаг. USB-ээр тархдаг шинж нь офлайн мэт санагддаг орчинд ч эрсдэл үүсгэж болно.
Практик зөвлөмж энгийн: танихгүй USB төхөөрөмж бүү залга, шилжүүлгийн өмнө wallet address-ийн эхлэл ба төгсгөлийг заавал тулга, endpoint хамгаалалтаа шинэчил. Байгууллагууд removable media policy болон crypto treasury ажилбарын хоёр шатны баталгаажуулалтаа шалгах хэрэгтэй.
Эх сурвалж: Microsoft discovers new lightweight backdoor that steals cryptocurrency6Dev ToolsGitHub Blog
GitHub pull request-ийн хязгаарлалтаар maintainer-уудын “чимээг” багасгана
GitHub нээлттэй эхийн төслүүдэд pull request-ийн урсгалыг зохицуулах хязгаарлалт хэрхэн тусалж байгааг тайлбарлав. Том community-тэй repository-д чанаргүй эсвэл хэт олон PR орж ирэх нь maintainer-уудын бодит ажлын ачаалал болдог.
Дэлгэрэнгүй унших
Нээлттэй эхийн төсөлд олон хүн хувь нэмэр оруулах нь сайн ч бүх PR үнэ цэнтэй байдаггүй. Review хийх, conflict засах, issue-тэй холбох, contributor-тэй харилцах зэрэг нь үнэгүй цаг шаарддаг далд зардал юм.
PR limit нь хувь нэмрийг хаах бус, дараалал ба чанарыг удирдах арга болж болно. Монголын dev багууд ч дотоод repository дээрээ WIP limit, review SLA, contribution guideline-аа тодорхой болгосноор кодын хяналтын bottleneck-ийг багасгаж чадна.
Эх сурвалж: How pull request limits are cutting down the noise7AINVIDIA Blog
AI factory-ууд цахилгаан сүлжээний холболтыг шинэ bottleneck болгож байна
NVIDIA FERC-ийн том ачааллын сүлжээний холболттой холбоотой шийдвэрийг AI factory, semiconductor fab, advanced manufacturing байгууламжуудад нөлөөлөх чухал алхам гэж онцоллоо. AI-ийн өсөлт зөвхөн GPU биш, цахилгаан сүлжээний бодит хүчин чадлаар хэмжигдэх болж байна.
Дэлгэрэнгүй унших
Дата төв, чипийн үйлдвэр, өндөр автоматжсан үйлдвэрлэл бүгд их хэмжээний тогтвортой эрчим хүч шаарддаг. Холболтын зөвшөөрөл, transmission capacity, peak load-ийн зохицуулалт удааширвал AI дэд бүтцийн төсөл GPU-тэй байсан ч ашиглалтад орохгүй.
Энэ нь Монголд ч сонирхолтой өнцөгтэй: дата төв, майнинг, AI тооцоолол, сэргээгдэх эрчим хүчний төслүүдийг салангид бус, сүлжээний төлөвлөлттэй хамт харах шаардлагатай. Дараагийн жилүүдэд “compute хаана барих вэ” гэдэг асуултад цахилгаан хамгийн хүчтэй хариулт өгнө.
Эх сурвалж: How FERC’s Large-Load Interconnection Actions Help Address Grid Stress, Improve Affordability