This trắng paper describes the components of Xe-HPG, a new high-performance graphics architecture designed for discrete GPUs.

Bạn đang xem: Intel® graphics solutions

Download PDF

Overview

The Intel® Arc™ A-series GPUs —formerly code-named Alchemist—feature Xe-HPG, a new high-performance graphics architecture designed for discrete GPUs. This white paper describes the components of Xe-HPG that deliver not only traditional rasterization and compute performance, but also real-time ray tracing & mesh shading for the next generation of PC gaming visuals. The paper serves as an introduction khổng lồ the Xe-HPG architecture, in tư vấn of the programming guides.

*

Figure 1. From the intel Arc A-series graphics: the ACM-G10 GPU, & the ACM-G11 GPU.

Xe-HPG Highlights

State-of-the-art immersive computer graphics for TV shows & movies are the current benchmark for visual effects achievement, which makes them the near-term goal for real-time gaming. This goal is driving an insatiable demand for the latest technologies & research.

Intel xe cộ Architecture is a proprietary Intel® GPU công nghệ that represents a significant leap in terms of efficiency và performance. Intel’s Xe-LP graphics was the first instance of this technology, pushing the performance on highly portable devices. Xe-HPG takes this baseline and springboards from it, with performance gains targeted at the discrete GPU market khổng lồ meet the consumer demand for PC gaming.

Intel’s Xe-HPG GPUs (such as the ACM-G10 và the ACM-G11) are built on Taiwan Semiconductor’s (TSMC) N6 process. The GPUs power nguồn the new hãng sản xuất intel Arc A-series discrete cards and mobile products (formerly code-named Alchemist, also referred lớn as DG2). While Xe-HPG will ship with a maximum of 32 Xe-cores, other reduced configurations match a complete family of SKUs.

The goal of the Xe-HPG design is lớn extend the baseline of significant architectural & micro-architectural enhancements provided by the Xe-LP architecture, và scale it up for highly performant discrete GPUs. Xe-HPG graphics architecture delivers a massive improvement in floating point & integer compute capabilities that takes advantage of a high-bandwidth memory hierarchy.

17 Teraflop SP FP32 Performance

Xe-HPG contains up lớn 32 Xe-cores & 512 vector engines (XVE), which increase the core compute capability per clock by greater than 51 over Xe-LP devices with up to lớn 96 vector engines, previously called EUs, or execution units. Additionally, it contains dedicated matrix engines (XMX), and a real-time ray tracing fixed-function block. Xe-HPG addresses the corresponding bandwidth needs by using the latest graphics memory technology (Graphics Double Data Rate 6, or GDDR6).

Xe-HPG has made considerable improvements lớn the Xe-LP design, realized in gaming and compute workloads. Advances were targeted lớn improve XVE latency, as well as increasing latency tolerance, & improvements in the caching hierarchy.

Deep Learning Inference Support

Deep learning (DL) applications have exceeded all expectations in the last five years. The primary building blocks of many deep learning applications are high-throughput multiply-accumulate operations. These can be used khổng lồ implement optimized deep learning convolutions, as well as optimized general matrix-multiply (GEMM) operations. In addition to increasing the peak FP32 performance 5x over Xe-LP, Xe-HPG includes XMX engines built with systolic arrays to lớn enable up khổng lồ 275 tera
OPS (TOPs) of compute performance. Xe-HPG supports FP16, BF16, INT8, INT4, và INT2 data formats khổng lồ provide a range of quantization for inferencing workloads, which can tolerate the lower precision.

Optimized use of this new hardware is exposed through Intel® Distribution of Open
VINO Toolkit™ & Microsoft* Win
ML APIs, as well as Intel-optimized Compute Library for Deep Neural Networks (CLDNN ) kernels. CLDNN is an hãng intel library built to expose optimized GPU implementations in the Intel® Deep Learning Deployment Toolkit and used by a variety of Intel-optimized deep learning (DL) frameworks, including Caffe*, Torch*, Tensor
Flow*, và Intel® Math Kernel Library for Deep Neural Networks (Intel® MKL-DNN).

Xe-HPG also supports all the Direct
X* 12 Ultimate features lớn provide the highest visual chất lượng without compromise, as described in the features that follow.

Xe-HPG has made considerable improvements lớn the Xe-LP design, realized in gaming và compute workloads. Advances were targeted to lớn improve XVE latency, as well as increasing latency tolerance, and improvements in the caching hierarchy.

Intel® Xe
Super Sampling (Xe
SS) for Gaming

One of the applications of the XMX engines in Xe-HPG is the application of Xe
SS, a method targeted at upscaling nội dung rendered at a lower resolution with up khổng lồ 4x increase in resolution while maintaining excellent image quality. Most modern games và game engines use a temporal antialiasing pass, and Xe
SS uses the available TAA inputs lớn upscale the resolution up lớn 4x, with little-to-no image quality impact.

Real-Time Ray Tracing

Ray tracing is widely regarded as the highest fidelity technique for simulating physical light behavior in 3 chiều graphics và is used in most offline-rendered computer-generated films. In games, ray tracing is used to enable global illumination, realistic shadows, reflections, ambient occlusion, và more. Games mandate high performance in real time and use rasterization instead of ray tracing; this enables a trade-off between quality and performance.

Current advances in the levels of performance allow for a hybrid model that enables ray-tracing effects layered alongside the traditional rasterization. Xe-HPG fully supports Direct
X* ray tracing (DXR) 1.0, DXR 1.1, and Vulkan* Run Time Libraries (Vulkan*RT); this enables ISVs to use the new ray-tracing techniques in their existing gaming pipelines.

Mesh Shading

The mesh-shading feature supports a one- or two-stage compute-like shader pipeline, which is used to generate 3 chiều primitives. These are fed directly into the existing rasterization pipeline. Mesh shading gives applications increased flexibility và performance for the definition and generation of 3 chiều primitives. The mesh-shading capability can be used as a replacement for the 3 chiều geometry pipeline (vertex input, vertex shading, tessellation, & geometry shading). Microsoft* introduced mesh-shading Tier 1 as a new feature in Direct
X 12 Ultimate*, & an extension also exists for Vulkan.

Variable Rate Shading

Variable rate shading (VRS) is a technique for giving the developer better control over which pixels lớn spend time shading. For example, if an object or region of the screen is undergoing motion blur, or objects are hidden behind smoke or fog, it often does not make sense khổng lồ spend time shading when the results are not seen by the user in the final image. Display densities have increased each generation, with double or even quadruple the number of pixels in the same region of space. This motivates the need for better control of the amount of shading across the display, so shading resources are used where they are needed the most.

While Xe-LP already supports VRS Tier 1, Xe-HPG additionally supports VRS Tier 2. VRS Tier 1 included the ability to lớn set the shading rate for every draw call. VRS Tier 2 enables you khổng lồ set the shading rate via an image mask, where each pixel of the image mask defines the shading rate for an 8x8 tile of the render target. Every tile of the image mask can be updated based on a variety of parameters that impact on the required shading resolution. For example, the amount of màu sắc intensity changes within a region of the previous frame. Motion of objects in the scene, camera parameters, or any number of other factors can vary across the display. In addition to lớn being able to lớn adjust the shading rate using an image mask, VRS Tier 2 also adds the ability to lớn set the shading rate for every triangle rendered, giving the programmer the ultimate level of control.

Intel supports a finer-grained image mask than other hardware vendors at 8x8, but also an expanded range of shading rates going beyond the standard 1x1, 1x2, 2x1, and 2x2, adding the ability lớn use shading rates 2x4, 4x2, and 4x4. These additional shading rates give the programmer even more control of performance, with no loss in perceived visual quality—a 4x4 coarse pixel has four times fewer invocations than a 2x2 coarse pixel. This means that the same number of displayable pixels can be shaded using only 25% of the resources when compared to lớn using 2x2 coarse pixels.

Sampler Feedback

Sampler feedback is a hardware-accelerated feature introduced in Direct
X Feature màn chơi 12_2 và supported by Xe-LP and later. Conceptually, it is the reverse of texture sampling: the sample() shader intrinsic reads a number of texels from a texture & returns an average value. The new Write
Sampler
Feedback() shader intrinsic writes to lớn a binary resource “marking” the texels that would have been read. This enables two important uses: sampler feedback streaming, and texture space shading.

This feature allows pixel shading lớn be independent of the geometric complexity of screen resolution and adds new texture level-of-detail methods to lớn control the level of shading detail. These abilities are introduced to lớn temporally decouple the shading pipeline from the traditional sample-, pixel-, or coarse-shading rates. Sampler feedback can provide sizable gains over traditional pixel-shader approaches, as shader complexity, geometry, or MSAA samples increases.

Unified Lossless Compression

Unified lossless compression is an evolution of Xe-LP’s end-to-end compression feature. Its primary purpose is lớn reduce read/write memory bandwidth và power. For memory-constrained workloads, it also improves overall system performance, and can be applied khổng lồ all resource types. It supports seamless consumer-producer paths across all rendering, display, compute, and truyền thông units.

High-Bandwidth Device Memory

Higher bandwidth requirements are driven by newer AI/DL inference workloads. Xe-HPG supports up to 17.5 GT/s per pin, using standard GDDR6 graphics memory. By supporting a maximum of eight channels in 2x16-bit configuration (which is a maximum of 256 bits), applications can get up khổng lồ 560 GB/s of low-latency bandwidth khổng lồ satiate Xe-HPG’s heavy compute needs.

From a memory footprint perspective, Xe-HPG supports from 4 GB lớn 16 GB of local memory, depending on the SKU.

PCI Express* Gen4

Xe-HPG supports a PCI Express* 4.0 host interface,

which provides a maximum of 32 GB/s in each direction for a x16 PCIe* 4.0 slot.

*

Figure 2. Xe-HPG maximum shipping configuration.

Xe-HPG Graphics Architecture

Xe-HPG graphics architecture is the next generation of discrete graphics, adding significant microarchitectural effort khổng lồ improve performance per-watt efficiency. Xe-HPG’s underlying architecture is scalable, so that devices can be constructed to lớn meet a wide range of hàng hóa performance demands across a wide range of thermal design power.

Xe-HPG has enhancements to support the latest APIs, including Direct
X 12 Ultimate features, & corresponding support in Vulkan APIs. As shown in Figure 2, the flagship device features eight render slices with four Xe-cores, each containing 16 XVEs for a total of 512 XVEs, and 16 MB of L2$, as shown in the following.

New Xe-HPG Render Slice và Xe-core Design

As with Xe-LP, the basic scalable building block of the

Xe-HPG compute + render engine architecture is called the “slice.” In Xe-HPG, the number of slices varies from 2 to 8, based on the SKU. Increasing the slice count increases overall 3D and compute assets in the machine in a balanced fashion, & can be leveraged lớn build a wide range of SKUs that tư vấn different power & performance needs.

Each slice is built from several Xe-cores, each of which contain 16 vector engines (XVE), 16 matrix engines (XMX), a load/store unit (or data port), and a shared L1/SLM cache. The current instance of the Xe-HPG slice contains a maximum of four Xe-cores.

Each Xe-core is attached to lớn a mix of dedicated graphics acceleration fixed function pipelines with a ray-tracing unit (RTU), a thread-sorting unit (TSU), and, of course, a sampler.

In addition, each slice contains the remainder of the fixed function blocks that tư vấn rendering functions, including geometry/tessellation, mesh dispatch logic, setup/raster, depth & stencil processing, pixel dispatch logic, and pixel back end. Xe-HPG has increased the fixed function-to- compute ratio, compared lớn Xe-LP, lớn address increasing requirements.

Xe-HPG's overall goal was lớn increase performance-per-watt or efficiency, through improvements in performance at frequency, increased frequency at voltage, and reduced energy per frame.

Performance at frequency was achieved via key architectural changes, as well as compiler optimizations targeting newer workloads. For Xe-HPG, there were significant efforts made to target higher frequency.

Additionally, the N6 process also offers additional v-f improvements. The goal was lớn achieve up khổng lồ 1.5x increase in frequency at iso voltage. Energy-per-frame is reduced by micro-architectural optimizations, & intrinsic dynamic capacitance (Cdyn) reductions. Reduction in bandwidth utilization through better caching & compression allows redirection of power to the GPU, improving performance.

These improvements allow Xe-HPG khổng lồ run up to 2.1 GHz in its most performant configuration. This allows Xe-HPG to deliver:

Up to lớn 17.2 TFLOPs of peak single precision (FP32) performance.Up to 137.6 TOPs of peak half precision (FP16) performance using XMX.Up to 275.2 TOPs of peak 8bit integer (INT8) performance using XMX.

*

Figure 3. Xe-HPG render slice.

Xe-core Overview

Xe-HPG brings considerable advances khổng lồ the Xe-core design, which are realized in gaming and compute workloads. The vector engine (XVE) is the subblock executing instructions, & is similar lớn the block named execution unit, or EU, in the Xe-LP architecture. In each XVE, the primary computation units are Single Instruction, Multiple Data (SIMD) floating-point units (known as arithmetic súc tích units, or ALUs). Although called ALUs, they can tư vấn floating-point and integer instructions such as MAD or MUL, as well as extended math (EM) instructions, such as exp, log, & rcp. In addition, the ALUs also support logical instructions. On Xe-LP architecture, each EU can co-issue an eight-wide ALU floating-point or integer instruction, plus a two-wide extended math instruction. Xe-LP also allows Send and Branch lớn be co-issued with the ALU operations.

From a raw compute perspective, Xe-HPG reorganized the ALUs with the ability to co-issue floating-point instructions & integer instructions on the XVEs. Xe-HPG also adds the xe cộ Matrix Extension (XMX), a new systolic array of ALUs.

This instruction, named Dot sản phẩm Accumulate Systolic (DPAS), can be co-issued as well.

Both architectures derive data-locality benefits from running two XVEs, or two EUs, in lockstep (see Figure 4).

*

Figure 4. Xe-LP execution unit (EU) versus Xe-HPG vector engine (XVE).

*

Figure 5. DP4A (Xe-LP và Xe-HPG) và DPAS (Xe-HPG only).

Xe-HPG makes further design changes lớn improve latencies, as well as improving latency tolerance by adding an additional thread per XVE và corresponding register tệp tin (GRF) increase.

Part of the Xe-core is also the instruction cache. Xe-HPG adds a prefetch mechanism khổng lồ improve the performance of kernels, which are short when instruction fetch constitutes much of the thread execution and displays a high degree of temporal và spatial locality.

Deep learning networks have become one of the biggest general-purpose GPU (GPGPU) usage models, & can use lower precision instructions with minor impact khổng lồ inference accuracy. As with Xe-LP, Xe-HPG supports INT8 accessed via DP4a instruction. However, one of the changes made to the Xe-core in Xe-HPG, is the addition of 16 XMX engines that can be accessed using the new Dot hàng hóa Accumulate Systolic (DPAS) instruction. It supports FP16, BF16, INT8, INT4 and INT2 multiply, with either 16 or 32 bits accumulate. Figure 5 shows both DP4A & DPAS instruction flow.

The throughput rates for the various instructions are shown in Table 1.

Metrics per EU/XVEXe-LPXe-HPG
FP32 FLOPs per Clock (MAD)1616
FP16 FLOPs per Clock (MAD)3232
INT32 Ops per Clock (ADD)88
INT16 Ops per Clock (MAD)3232
INT8 Ops per Clock (DP4A)6464
XMX FP16 Ops per Clock (DPAS)-128
XMX BF16 Ops per Clock (DPAS)-128
XMX INT8 Ops per Clock (DPAS)-256
XMX INT4/INT2 Ops per Clock (DPAS)-512
Extended Math Ops per Clock (EXP, RCP)22
Thread Count78
Register File28KB32KB

Table 1. EU/XVE throughput rates.

Xe-core Fixed Function

The texture sampler is a critical unit attached to the Xe-core that supports up lớn a peak of eight texels per clock, similar to lớn Xe-LP. Intel improved the sampler capability to run at higher frequencies, but there are also other performance optimizations. One of the notable changes is improved anisotropic performance for some of the block compression (BCx) formats, which are common in games. Other improvements enhance power nguồn efficiency as well as performance for certain formats commonly used in games.

To include state-of-the-art lighting & visualization, each of the Xe-cores contains a ray-tracing unit (RTU). RTUs process ray-tracing related messages from the XVEs to lớn kick off traversal including intersection tests. Each RTU has a bounding volume hierarchy (BVH) cache lớn reduce the average latency of fetching BVH data and is capable of processing multiple rays for higher efficiency. Each RTU supports a 12–to–1 ratio of ray-box intersection tests per clock và ray-triangle tests per clock.

Additionally, each RTU is supported by a thread-sorting unit (TSU), a dedicated hardware block that can sort và re-emit shader threads to maximize SIMD coherence from divergent rays.

Xe-core L1$

To meet the high bandwidth demand of the XMX instructions & the ray-tracing units, Xe-HPG implements a newly designed read/write L1-cache unit in each Xe-core. The new L1-cache unit handles all unformatted load/store accesses lớn memory, & shared local memory (SLM). Based on the shader requirement, the cache storage can be dynamically partitioned between L1-cache and SLM, featuring up to lớn 192 KB of L1 cache or up lớn 128 KB of SLM. Formatted data load/ store (such as typed unordered access views ) are handled by the data port pipeline, which shares a separate, 64 KB read-only cache with the texture sampler unit.

In addition to improving the performance of ML/DL workloads & ray tracing, the low-latency, high-bandwidth L1 cache also improves shaders with frequent accesses to SLM, dynamically indexed constant buffers, và high register spill-fills.

*

Figure 6. New shared local memory (SLM) and L1$.

Xe-HPG Slice Common

The Xe-HPG geometry fixed function pipeline contains the typical render front over that maps khổng lồ the logical API pipeline. Enhancements include provisions to tư vấn distribution of the geometry work between the various slices for larger devices, while increasing peak fixed-function rate.

A significant change is the addition of a two-stage mesh-shading pipeline introduced in Direct
X Ultimate as well as Vulkan.

Although mesh-shading functionality appears to software as a separate pipeline feeding into the rasterization function, the implementation is an alternate operating mode of the geometry fixed function, leveraging similar existing device assets. When operating in mesh-shading mode:

The global vertex fetch distributes geometry work khổng lồ slices when in geometry mode và is reused to distribute mesh-shader dispatch work lớn slices in a load-balanced fashion.The Hull Shader (HS) stage in each slice geometry pipeline alternatively supports the optional Amplification Shader (AS) stage of the mesh-shader compute pipeline.In geometry mode, the tessellation (TE) stage xúc tích in each slice geometry pipeline & the tessellation redistribution (TED) súc tích in the shared functions are used lớn redistribute tessellation work (produced by the slices’ HS stages) across the lower portions of the slices’ geometry pipelines. In mesh-shading mode, this lô ghích is reused khổng lồ redistribute & load-balance mesh-shading thread-group work across the geometry pipelines.The geometry shader (GS) stage in each slice geometry pipeline alternatively supports the mesh shader (MS) stage of the mesh-shader compute pipeline. Outputs of the GS (in either geometry or mesh-shading mode) are passed down lớn the rasterization pipeline.

To support the rendering of mesh-shading output, the xe rasterization pipeline is extended to tư vấn per-primitive pixel-shader attributes, in addition khổng lồ the existing per-vertex attributes. Peak rates for mesh-shading function are provided in Table 2.

Key Peak Metrics
Clocks/Dispatch/Slice
Amplification Shader (AS) Null Output2
Mesh Shader (MS) only Null Output1
Amplification Shader (AS) Mesh
Shader Launch Count = 1
9

Table 2. Key peak metrics for mesh shading.

Additionally, the slice common also includes the px dispatch unit, which accumulates subspans/pixel information and dispatches threads to the XVEs. The block load balances across the multiple Xe-cores and ensures the order in which pixels retire from the shader units. It also includes support for variable rate shading (VRS), which reduces the px shader invocations, and in Xe-HPG has been enhanced from Tier 1 lớn Tier 2 support.

Depth tests are performed at two levels of granularity: coarse và fine. The coarse tests are performed by hierarchical depth (Hi
Z) where testing is done on 8x4 px block granularity. In addition, the Hi
Z block supports fast clear, which allows clearing depth without writing the depth buffer.

The pixel back over (PBE) is the last stage of the rendering pipeline, which includes the cache lớn hold the màu sắc values backed by the L2 cache. This pipeline stage also handles the color blend functions across several source and destination surface formats. Each PBE supports up lớn 8 pixels/clock for alpha-blended surfaces for a total of 16 pixels/clock per render slice.

L2 Cache, Compression, và Memory

L2 cache is the last level cache in the memory hierarchy. Memory requests from all the render slices và Xe-cores are directed lớn the L2 cache. As such, it is the largest unified storage structure within the IP, and serves as the final filter for data moving to & from device memory. The L2 cache is used as backing storage for sampler, data port, color, Z, UAV, and instruction streams.

The L2 cache is a highly banked multiway set-associative cache. Fine-grain controls in the L2 allow selective caching of data, as well as provisioning of different classes of services lớn streams of traffic. Each of the banks can perform one 64 byte read-or-write operation every clock. The L2 cache forms a single contiguous memory space across all the banks và sub-banks in the design. The 32 Xe-cores configuration supports a peak of 2048 bytes/clock for read or write. In typical 3D/compute workloads, partial access is common and occurs in batches, making ineffective use of memory bandwidth. L2 cache opportunistically combines partial accesses into a single 64Byte access, improving efficiency.

Xe-HPG graphics architecture continues the investment in technologies that improve graphic memory efficiency, in addition to improving raw memory bandwidth. As games target higher unique visuals, the memory bandwidth requirement significantly increases. Xe-HPG uses a new unified, lossless compression algorithm that is universal across color, depth, & stencil, as well as truyền thông and compute. The data can be stored in the L2 cache in compressed as well as uncompressed form, yielding benefit for both capacity and bandwidth.

Global Assets

Global Assets presents a hardware & software interface to & from the GPU, including power management.

Specifications Tables

Peak Rates

Table 3, below, presents the theoretical peak throughput of the compute architecture of Intel® processor graphics, aggregated across the entire graphics hàng hóa architecture. Values are stated as “per clock cycle.”

Key Peak MetricsXe-LPXe-HPG Xe-HPG
# of Xe-cores / Slice6 (subslices)44
# of XVEs/EUs (Total)96 (1x6x16)128 (2x4x16)512 (8x4x16)
FP32 (SP) FLOPs/Clock153620488192
FP16 (SP) FLOPs/Clock3072409616384
INT32 IOPs/Clock (ADD)76810244096
INT8 IOPs/Clock (DP4a)6144819232768
XMX FP16 Ops per Clock (DPAS)-1638465536
XMX BF16 Ops per Clock (DPAS)-1638465536
XMX INT8 Ops per Clock (DPAS)-32768131072
XMX INT4/INT2 Ops per Clock (DPAS)-65536262144
General Register File/XVE (KB)283232
Total Register file (KB)2688409616384
# of Samplers6832
Point/Bilinear Texel’s/Clock (32 bpt)4864256
Point/Bilinear Texel’s/Clock (64 bpt)4864256
Trilinear Texel's /Clock (32 bpt)2432128
Ray-Box Intersect/Clock-96384
Ray-Triangle Intersect/Clock-832
L1$ Total (KB)38415366144
Shared Local Memory Total (KB)76810244096
Key Peak MetricsXe-LP Xe-HPG Xe-HPG
Slice Common & Geometry Attributes
Pixel Fill – RGBA8 (Pixels/Clock)2432128
Pixel Fill w. Alpha Blend - RGBA8 (Pixels/Clock)2432128
Hi
Z Pixels/Clock
2565122048
Backface Cull – strips (Prim/Clock)2416
Backface Cull – lists (Prim/Clock)0.672.6610.64
L2$ Cache (KB)16384409616384
Memory Subsystem Attributes
Memory Configuration (bits)12896256
Max Memory Data Rate (GT/s)4.26715.517.5
Max Frame Buffer kích thước (GB)4616
Memory Bandwidth (GB/s)68186560

Table 3. The theoretical peak throughput of Xe-HPG and Xe-LP.

Graphics API Support

Xe-HPG supports all the major APIs: Direct
X, Open
GL*, Vulkan, and Open
CL™. Table 4 below shows the features discussed above, and others that are part of Direct 3 chiều 12 & Vulkan, mapped to Xe-LP & Xe-HPG.

API Support

Direct
X* 12

Vulkan*

Xe-LP

Xe-HPG

Xe-LP

Xe-HPG

Max Feature Level12_112_2--
Shader Model6_66_6--
Resource BindingTier 3Tier 3Based on Driver QueryBased on Driver Query
Typed UAV LoadsYesYesYesYes
Conservative RasterizationTier 3Tier 3Yes – VK_KHR_ conservative_ rasterizationYes – VK_KHR_ conservative_ rasterization
Rasterizer-Ordered ViewsYesYesYes – VK_EXT_ fragment_shader_ interlockYes – VK_EXT_ fragment_shader_ interlock
Stencil Reference OutputYesYesVK_EXT_shader_ stencil_exportVK_EXT_shader_ stencil_export
UAV SlotsFull HeapFull HeapBased on Driver QueryBased on Driver Query
Resource HeapTier 2Tier 2--
Variable Rate ShadingTier 1Tier 2Yes – VK_KHR_fragment_ shading_rateYes – VK_KHR_fragment_ shading_rate
View InstancingTier 2Tier 2Yes - VK_KHR_multiviewYes - VK_KHR_multiview
Asynchronous ComputeYesYesYesYes
Depth Bounds TestYesYesYesYes
Sampler FeedbackTier 0.9Tier 0.9TBDTBD
Ray TracingNoTier 1.1NoYes – extensions
Mesh ShadingNoTier 1.0NoYes – extensions

Table 4. D3D12 và Vulkan APIs tư vấn for Xe-LP and Xe-HPG.

Conclusion

The Xe-HPG architecture provides scalability & a modern Direct
X 12 Ultimate graphics feature set khổng lồ power the intel Arc A-series hàng hóa line. The following guides are khổng lồ help you go further & fully use the Xe-HPG architecture for your graphics applications.


Trò chơi thông tin chi tiết

Phiên bản11.8
Kích thước180M
Ngày phân phát hành13 tháng 11, 2021
LoạiMô phỏng Trò chơi

Sự miêu tả:Trò nghịch này là một trong những trò nghịch mô phỏng, nơi các bạn có ... <đọc thêm>


Tương ham mê với Windows 11/10/8/7 Pc & Laptop

Tải xuống bên trên PC

Tương thích hợp với Android

Tải xuống trên Android

Xem những phiên bạn dạng cũ hơn


Bản coi trước ứng dụng ()

*

Đang tìm cách tải xuống Trò nghịch lái xe cộ 3D dành riêng cho PC Windows 11/10/8/7? khi đó bạn sẽ ở đúng nơi. Hãy liên tiếp đọc bài viết này để hiểu cách chúng ta cũng có thể Tải xuống và thiết đặt một một trong những ứng dụng rất tốt Mô phỏng Trò nghịch Trò chơi lái xe 3d cho PC.

Hầu hết các ứng dụng có sẵn trên google Play Store hoặc i
OS Appstore phần lớn được sản xuất giành riêng cho các nền tảng gốc rễ di động. Nhưng chúng ta có biết các bạn vẫn có thể sử dụng ngẫu nhiên ứng dụng app android hoặc i
OS yêu mến nào trên máy tính xách tay xách tay của mình ngay cả lúc phiên bạn dạng chính thức giành riêng cho nền tảng PC không có sẵn? Có, chúng ta thực hiện một trong những thủ thuật dễ dàng và đơn giản mà chúng ta có thể sử dụng để thiết đặt ứng dụng app android trên sản phẩm công nghệ Windows và thực hiện chúng như biện pháp bạn sử dụng trên điện thoại thông minh thông minh Android.

Ở trên đây trong bài viết này, cửa hàng chúng tôi sẽ liệt kê những cách khác biệt để Tải xuống Trò chơi lái xe 3 chiều trên PC trong gợi ý từng bước. Bởi vậy, trước khi khám phá về nó, chúng ta hãy coi các thông số kỹ thuật kỹ thuật của Trò nghịch lái xe pháo 3D.

Trò nghịch lái xe 3 chiều cho PC - thông số kỹ thuật

TênTrò chơi lái xe 3D
Cài đặt500.000+
Được trở nên tân tiến bởiJ.H. Games

Trò nghịch lái xe pháo 3D đứng đầu list Mô phỏng ứng dụng danh mục trên Google Playstore. Nó đã có điểm reviews và nhấn xét thực thụ tốt. Hiện nay tại, Trò đùa lái xe 3 chiều cho Windows đã kết thúc 500.000+ Trò chơi sở hữu đặt and 4.4 ngôi sao điểm xếp thứ hạng tổng thích hợp của người tiêu dùng trung bình.


Trò nghịch lái xe 3 chiều Tải xuống cho PC máy tính xách tay Windows 11/10/8/7:

Hầu hết những ứng dụng ngày này chỉ được trở nên tân tiến cho nền tảng gốc rễ di động. Các trò đùa và vận dụng như PUBG, người lướt tàu điện ngầm, Snapseed, Beauty Plus, v.v. Chỉ gồm sẵn cho căn cơ Android cùng i
OS. Dẫu vậy trình đưa lập Android chất nhận được chúng tôi sử dụng toàn bộ các áp dụng này bên trên PC.

Vì vậy, trong cả khi phiên bản chính thức của Trò chơi lái xe pháo 3D so với PC không khả dụng, bạn vẫn có thể sử dụng nó với sự trợ góp của Trình đưa lập. Ở đây trong nội dung bài viết này, cửa hàng chúng tôi sẽ giới thiệu cho bạn hai trong số các trình đưa lập Android thịnh hành để thực hiện Trò nghịch lái xe 3d trên PC.

Trò đùa lái xe 3d Tải xuống đến PC Windows 11/10/8/7 – phương thức 1:

Bluestacks là trong những Trình mang lập thú vị nhất cùng được sử dụng rộng rãi để chạy những ứng dụng apk trên PC Windows của bạn. Phần mềm Bluestacks thậm chí còn có sẵn mang đến Mac OS. Shop chúng tôi sẽ thực hiện Bluestacks trong cách thức này để cài xuống và thiết lập Trò chơi lái xe 3 chiều cho PC Windows 11/10/8/7 máy tính xách tay xách tay. Hãy bước đầu hướng dẫn thiết lập từng bước của bọn chúng tôi.

Bước 2: Thủ tục setup khá đơn giản dễ dàng và dễ hiểu. Sau khi thiết đặt thành công, mở giả lập Bluestacks.Bước 3: hoàn toàn có thể mất một chút thời hạn để tải vận dụng Bluestacks ban đầu. Sau khoản thời gian nó được mở, bạn sẽ có thể quan sát thấy màn hình hiển thị chính của Bluestacks.Bước 4: siêu thị Google Play được cài đặt sẵn vào Bluestacks. Trên màn hình chính, hãy search Playstore với nhấp đúp vào hình tượng để mở nó.Bước 5: hiện nay hãy tìm kiếm Trò chơi bạn muốn cài để trên PC của mình. Vào trường hợp của chúng tôi, hãy tìm kiếm kiếm Trò đùa lái xe pháo 3D nhằm cài đặt lên trên PC.Bước 6: khi bạn nhấp vào nút cài đặt, Trò đùa lái xe pháo 3D sẽ tiến hành cài đặt auto trên Bluestacks. Chúng ta cũng có thể tìm thấy Trò nghịch Dưới danh sách các ứng dụng đã cài đặt vào Bluestacks.

Bây tiếng bạn chỉ việc nhấp đúp vào Trò chơi biểu tượng trong bluestacks và bắt đầu sử dụng Trò đùa lái xe 3 chiều Trò chơi trên máy tính xách tay của bạn. Chúng ta có thể dùng Trò chơi hệt như cách bạn thực hiện nó trên smartphone thông minh apk hoặc i
OS của mình.

Nếu các bạn có tệp APK, thì tất cả một tùy chọn trong Bluestacks nhằm Nhập tệp APK. Bạn không nhất thiết phải truy cập shop Google Play và thiết lập trò chơi. Tuy nhiên, sử dụng cách thức tiêu chuẩn chỉnh để download đặt ngẫu nhiên ứng dụng apk nào được khuyến khích.

Phiên bạn dạng Bluestacks mới nhất đi kèm với tương đối nhiều tính năng hay vời. Bluestacks4 cấp tốc hơn 6 lần so với điện thoại cảm ứng thông minh Samsung Galaxy J7. Vì chưng vậy, áp dụng Bluestacks là bí quyết được khích lệ để setup Trò chơi lái xe 3d trên PC. Bạn cần phải có một PC thông số kỹ thuật tối thiểu để áp dụng Bluestacks. Trường hợp không, bạn có thể gặp đề nghị sự thế tải khi tập luyện các trò chơi thời thượng như PUBG

Trò nghịch lái xe 3 chiều Tải xuống đến PC Windows 11/10/8/7 – cách thức 2:

Tuy nhiên, một trình trả lập Android thông dụng khác vẫn được tương đối nhiều người để ý trong thời gian vừa mới đây là MEmu play. Nó khôn xiết linh hoạt, mau lẹ và được thiết kế với dành riêng rẽ cho mục tiêu chơi game. Bây chừ chúng ta vẫn xem làm rứa nào để Tải xuống Trò đùa lái xe cộ 3D dành cho PC Windows 11 hoặc 10 hoặc 8 hoặc 7 máy tính xách tay sử dụng Memu
Play.

Bước 2: sau khoản thời gian trình đưa lập được tải đặt, chỉ việc mở nó và tìm siêu thị Google Play Trò chơi biểu tượng trên màn hình chính của Memuplay. Chỉ cần nhấn đúp vào đó nhằm mở.Bước 3: bây chừ Tìm kiếm Trò đùa lái xe 3 chiều Trò chơi trên siêu thị Google Play. Tìm đồng ý Trò nghịch từ J.H. Games nhà cải cách và phát triển và nhấp vào nút thiết lập đặt.Bước 4: Sau khi setup thành công, bạn có thể tìm thấy Trò chơi lái xe 3 chiều trên màn hình chính của MEmu Play.

Memu
Play là 1 trong những ứng dụng dễ dàng và dễ sử dụng. Nó rất nhẹ đối với Bluestacks. Vày nó có phong cách thiết kế cho mục đích chơi game nên chúng ta có thể chơi những trò chơi thời thượng như PUBG, Mini Militia, Temple Run, v.v..

Xem thêm: Cách Phân Biệt Phong Cách Thiết Kế Nội Thất Vintage Đẹp, Nội Thất Vintage Là Gì

Trò nghịch lái xe 3d cho PC - Kết luận:

Trò nghịch lái xe 3 chiều đã trở nên thông dụng rộng rãi cùng với giao diện dễ dàng nhưng công dụng của nó. Shop chúng tôi đã liệt kê hai trong các các phương thức tốt độc nhất để thiết đặt Trò nghịch lái xe 3 chiều trên PC máy tính xách tay Windows. Cả hai trình mang lập được đề cập đều phổ biến để sử dụng Ứng dụng trên PC. Bạn cũng có thể làm theo ngẫu nhiên phương pháp nào dưới đây để nhận thấy Trò nghịch lái xe cộ 3D dành riêng cho PC Windows 11 hoặc Windows 10.

Chúng tôi đã kết thúc bài viết này về Trò đùa lái xe 3d Tải xuống đến PC Với mẫu này. Nếu khách hàng có ngẫu nhiên thắc mắc làm sao hoặc gặp ngẫu nhiên sự nuốm nào khi thiết lập Trình mô bỏng hoặc Trò nghịch lái xe 3d cho Windows, cho chúng tôi biết thông qua các bình luận. Công ty chúng tôi sẽ sẵn lòng góp bạn!


Tải xuống những phiên bản cũ hơn