用户态进程如何得到虚拟地址对应的物理地址?

云计算 虚拟化
一般我们不需要从用户态得到进程虚拟地址对应的物理地址,因为一般来说用户进程是完全不关心物理地址的。

[[345236]]

一般我们不需要从用户态得到进程虚拟地址对应的物理地址,因为一般来说用户进程是完全不关心物理地址的。

少数应用场景下,用户可能会关心,比如在用户态做DMA的场景(如DPDK之类的)。还有一些场景,比如想调试剖析每一页的内存占用情况,是否swap出去了等。

从用户态得到虚拟地址对应的物理地址,我们不可能去walk进程的page table,也没有权限。不过还好内核给我们提供了一个接口,叫pagemap,而且,这个接口与硬件的体系架构无关。在/proc/pid/下面有个文件叫pagemap,它会每个page,生成了一个64bit的描述符,来描述虚拟地址这一页对应的物理页帧号或者SWAP里面的便宜,详见文档:

linux/Documentation/admin-guide/mm/pagemap.rst

这64bit的描述如下:

 

不同的体系架构的MMU不同,页表格式也不同,但是pagemap这个接口与具体页表的格式无关,可以说都被抽象化了。

下面我们忽略swap的影响(假设关闭了swap或者page一直是pin的状态),从DPDK抄一段虚拟地址转换为物理地址的代码:

  1. #define phys_addr_t     uint64_t 
  2. #define PFN_MASK_SIZE   8 
  3.  
  4. phys_addr_t 
  5. rte_mem_virt2phy(const void *virtaddr) 
  6.         int fd, retval; 
  7.         uint64_t page, physaddr; 
  8.         unsigned long virt_pfn; 
  9.         int page_size; 
  10.         off_t offset; 
  11.  
  12.         /* standard page size */ 
  13.         page_size = getpagesize(); 
  14.  
  15.         fd = open("/proc/self/pagemap", O_RDONLY); 
  16.         if (fd < 0) {  
  17.                 ... 
  18.         } 
  19.  
  20.         virt_pfn = (unsigned long)virtaddr / page_size; 
  21.         offset = sizeof(uint64_t) * virt_pfn; 
  22.         if (lseek(fd, offset, SEEK_SET) == (off_t) -1) { 
  23.                 ... 
  24.                 return -1; 
  25.         } 
  26.  
  27.         retval = read(fd, &page, PFN_MASK_SIZE); 
  28.         close(fd); 
  29.         ... 
  30.  
  31.         /* 
  32.          * the pfn (page frame number) are bits 0-54 (see 
  33.          * pagemap.txt in linux Documentation) 
  34.          */ 
  35.         if ((page & 0x7fffffffffffffULL) == 0) 
  36.                 return -1; 
  37.  
  38.         physaddr = ((page & 0x7fffffffffffffULL) * page_size) 
  39.                 + ((unsigned long)virtaddr % page_size); 
  40.  
  41.         return physaddr; 

最后的一步是关键的计算过程:

  1. physaddr = ((page & 0x7fffffffffffffULL) * page_size) 
  2.                 + ((unsigned long)virtaddr % page_size); 

page & 0x7fffffffffffffULL取得了页帧号(PFN),乘以页的size得到这页起始的物理地址,之后加上virtaddr % page_size的页内偏移,得到最终的物理地址。

我们来实操一下调用上面的函数完成地址转化:

  1. int main(int argc, char *argv[]) 
  2.   uint8_t *p = malloc(1024 * 1024); 
  3.  
  4.   *(p + 4096) = 10; 
  5.   printf("virt:%p phys:%p\n", p + 4096, rte_mem_virt2phy(p + 4096)); 
  6.  
  7.   *(p + 2 * 4096) = 10; 
  8.   printf("virt:%p phys:%p\n", p + 2 * 4096, rte_mem_virt2phy(p + 2 * 4096)); 

运行结果如下:

  1. ~$ sudo ./a.out  
  2. virt:0x7f81e402a010 phys:0x2b601010 
  3. virt:0x7f81e402b010 phys:0x3ceec010 

内核态实现pagemap proc接口的代码位于:

  1. fs/proc/task_mmu.c 

其中比较核心的函数是把PTE转换为pagemap_entry的过程,有兴趣的童鞋可以仔细阅读下:

 

 

特别留意画红线的位置,可以知道pagemap里面的那些flag是怎么被置上的。

本文转载自微信公众号「Linux阅码场」,可以通过以下二维码关注。转载本文请联系Linux阅码场公众号。   

 

责任编辑:武晓燕 来源: Linux阅码场
相关推荐

2019-07-10 12:40:29

Linux虚拟地址空间物理地址空间

2010-02-24 14:41:16

WCF物理地址

2022-05-18 13:46:37

进程TLB虚拟地址

2021-10-17 19:48:10

扩展页表虚拟机

2023-07-06 00:45:05

Linux保护模式

2019-01-03 16:04:13

内存Linux PoC

2009-12-09 09:30:04

LinuxuClinux

2017-11-16 09:20:20

内存虚拟化技术

2021-01-31 09:26:15

ARM64内核虚拟地址Linux

2009-10-19 09:45:06

linux内存存管理

2010-02-24 16:14:26

Linux内存

2016-11-16 09:52:39

Linux读书笔记内核

2017-07-25 15:09:48

Linux地址转化

2025-01-13 00:30:17

2022-02-24 07:56:27

Linux系统ELF

2020-07-13 07:54:20

缓存系统高并发

2024-04-29 13:50:00

2020-11-20 07:55:55

Linux内核映射

2018-05-03 15:03:09

内存虚拟化空间

2023-04-13 08:09:35

操作系统虚拟地址内存
点赞
收藏

51CTO技术栈公众号