xref: /linux/drivers/vfio/pci/vfio_pci_rdwr.c (revision bc93b9ae0151ae5ad5b8504cdc598428ea99570b)
1d2912cb1SThomas Gleixner // SPDX-License-Identifier: GPL-2.0-only
289e1f7d4SAlex Williamson /*
389e1f7d4SAlex Williamson  * VFIO PCI I/O Port & MMIO access
489e1f7d4SAlex Williamson  *
589e1f7d4SAlex Williamson  * Copyright (C) 2012 Red Hat, Inc.  All rights reserved.
689e1f7d4SAlex Williamson  *     Author: Alex Williamson <alex.williamson@redhat.com>
789e1f7d4SAlex Williamson  *
889e1f7d4SAlex Williamson  * Derived from original vfio:
989e1f7d4SAlex Williamson  * Copyright 2010 Cisco Systems, Inc.  All rights reserved.
1089e1f7d4SAlex Williamson  * Author: Tom Lyon, pugs@cisco.com
1189e1f7d4SAlex Williamson  */
1289e1f7d4SAlex Williamson 
1389e1f7d4SAlex Williamson #include <linux/fs.h>
1489e1f7d4SAlex Williamson #include <linux/pci.h>
1589e1f7d4SAlex Williamson #include <linux/uaccess.h>
1689e1f7d4SAlex Williamson #include <linux/io.h>
1730656177SAlex Williamson #include <linux/vfio.h>
1884237a82SAlex Williamson #include <linux/vgaarb.h>
1989e1f7d4SAlex Williamson 
2089e1f7d4SAlex Williamson #include "vfio_pci_private.h"
2189e1f7d4SAlex Williamson 
2207fd7ef3SAlex Williamson #ifdef __LITTLE_ENDIAN
2307fd7ef3SAlex Williamson #define vfio_ioread64	ioread64
2407fd7ef3SAlex Williamson #define vfio_iowrite64	iowrite64
2507fd7ef3SAlex Williamson #define vfio_ioread32	ioread32
2607fd7ef3SAlex Williamson #define vfio_iowrite32	iowrite32
2707fd7ef3SAlex Williamson #define vfio_ioread16	ioread16
2807fd7ef3SAlex Williamson #define vfio_iowrite16	iowrite16
2907fd7ef3SAlex Williamson #else
3007fd7ef3SAlex Williamson #define vfio_ioread64	ioread64be
3107fd7ef3SAlex Williamson #define vfio_iowrite64	iowrite64be
3207fd7ef3SAlex Williamson #define vfio_ioread32	ioread32be
3307fd7ef3SAlex Williamson #define vfio_iowrite32	iowrite32be
3407fd7ef3SAlex Williamson #define vfio_ioread16	ioread16be
3507fd7ef3SAlex Williamson #define vfio_iowrite16	iowrite16be
3607fd7ef3SAlex Williamson #endif
3707fd7ef3SAlex Williamson #define vfio_ioread8	ioread8
3807fd7ef3SAlex Williamson #define vfio_iowrite8	iowrite8
3907fd7ef3SAlex Williamson 
40*bc93b9aeSAlex Williamson #define VFIO_IOWRITE(size) \
41*bc93b9aeSAlex Williamson static int vfio_pci_iowrite##size(struct vfio_pci_device *vdev,		\
42*bc93b9aeSAlex Williamson 			bool test_mem, u##size val, void __iomem *io)	\
43*bc93b9aeSAlex Williamson {									\
44*bc93b9aeSAlex Williamson 	if (test_mem) {							\
45*bc93b9aeSAlex Williamson 		down_read(&vdev->memory_lock);				\
46*bc93b9aeSAlex Williamson 		if (!__vfio_pci_memory_enabled(vdev)) {			\
47*bc93b9aeSAlex Williamson 			up_read(&vdev->memory_lock);			\
48*bc93b9aeSAlex Williamson 			return -EIO;					\
49*bc93b9aeSAlex Williamson 		}							\
50*bc93b9aeSAlex Williamson 	}								\
51*bc93b9aeSAlex Williamson 									\
52*bc93b9aeSAlex Williamson 	vfio_iowrite##size(val, io);					\
53*bc93b9aeSAlex Williamson 									\
54*bc93b9aeSAlex Williamson 	if (test_mem)							\
55*bc93b9aeSAlex Williamson 		up_read(&vdev->memory_lock);				\
56*bc93b9aeSAlex Williamson 									\
57*bc93b9aeSAlex Williamson 	return 0;							\
58*bc93b9aeSAlex Williamson }
59*bc93b9aeSAlex Williamson 
60*bc93b9aeSAlex Williamson VFIO_IOWRITE(8)
61*bc93b9aeSAlex Williamson VFIO_IOWRITE(16)
62*bc93b9aeSAlex Williamson VFIO_IOWRITE(32)
63*bc93b9aeSAlex Williamson #ifdef iowrite64
64*bc93b9aeSAlex Williamson VFIO_IOWRITE(64)
65*bc93b9aeSAlex Williamson #endif
66*bc93b9aeSAlex Williamson 
67*bc93b9aeSAlex Williamson #define VFIO_IOREAD(size) \
68*bc93b9aeSAlex Williamson static int vfio_pci_ioread##size(struct vfio_pci_device *vdev,		\
69*bc93b9aeSAlex Williamson 			bool test_mem, u##size *val, void __iomem *io)	\
70*bc93b9aeSAlex Williamson {									\
71*bc93b9aeSAlex Williamson 	if (test_mem) {							\
72*bc93b9aeSAlex Williamson 		down_read(&vdev->memory_lock);				\
73*bc93b9aeSAlex Williamson 		if (!__vfio_pci_memory_enabled(vdev)) {			\
74*bc93b9aeSAlex Williamson 			up_read(&vdev->memory_lock);			\
75*bc93b9aeSAlex Williamson 			return -EIO;					\
76*bc93b9aeSAlex Williamson 		}							\
77*bc93b9aeSAlex Williamson 	}								\
78*bc93b9aeSAlex Williamson 									\
79*bc93b9aeSAlex Williamson 	*val = vfio_ioread##size(io);					\
80*bc93b9aeSAlex Williamson 									\
81*bc93b9aeSAlex Williamson 	if (test_mem)							\
82*bc93b9aeSAlex Williamson 		up_read(&vdev->memory_lock);				\
83*bc93b9aeSAlex Williamson 									\
84*bc93b9aeSAlex Williamson 	return 0;							\
85*bc93b9aeSAlex Williamson }
86*bc93b9aeSAlex Williamson 
87*bc93b9aeSAlex Williamson VFIO_IOREAD(8)
88*bc93b9aeSAlex Williamson VFIO_IOREAD(16)
89*bc93b9aeSAlex Williamson VFIO_IOREAD(32)
90*bc93b9aeSAlex Williamson 
9189e1f7d4SAlex Williamson /*
92906ee99dSAlex Williamson  * Read or write from an __iomem region (MMIO or I/O port) with an excluded
93906ee99dSAlex Williamson  * range which is inaccessible.  The excluded range drops writes and fills
94906ee99dSAlex Williamson  * reads with -1.  This is intended for handling MSI-X vector tables and
95906ee99dSAlex Williamson  * leftover space for ROM BARs.
9689e1f7d4SAlex Williamson  */
97*bc93b9aeSAlex Williamson static ssize_t do_io_rw(struct vfio_pci_device *vdev, bool test_mem,
98*bc93b9aeSAlex Williamson 			void __iomem *io, char __user *buf,
99906ee99dSAlex Williamson 			loff_t off, size_t count, size_t x_start,
100906ee99dSAlex Williamson 			size_t x_end, bool iswrite)
10189e1f7d4SAlex Williamson {
102906ee99dSAlex Williamson 	ssize_t done = 0;
103*bc93b9aeSAlex Williamson 	int ret;
10489e1f7d4SAlex Williamson 
10589e1f7d4SAlex Williamson 	while (count) {
10689e1f7d4SAlex Williamson 		size_t fillable, filled;
10789e1f7d4SAlex Williamson 
108906ee99dSAlex Williamson 		if (off < x_start)
109906ee99dSAlex Williamson 			fillable = min(count, (size_t)(x_start - off));
110906ee99dSAlex Williamson 		else if (off >= x_end)
111906ee99dSAlex Williamson 			fillable = count;
11289e1f7d4SAlex Williamson 		else
11389e1f7d4SAlex Williamson 			fillable = 0;
11489e1f7d4SAlex Williamson 
115906ee99dSAlex Williamson 		if (fillable >= 4 && !(off % 4)) {
11607fd7ef3SAlex Williamson 			u32 val;
11789e1f7d4SAlex Williamson 
11889e1f7d4SAlex Williamson 			if (iswrite) {
11989e1f7d4SAlex Williamson 				if (copy_from_user(&val, buf, 4))
120906ee99dSAlex Williamson 					return -EFAULT;
12189e1f7d4SAlex Williamson 
122*bc93b9aeSAlex Williamson 				ret = vfio_pci_iowrite32(vdev, test_mem,
123*bc93b9aeSAlex Williamson 							 val, io + off);
124*bc93b9aeSAlex Williamson 				if (ret)
125*bc93b9aeSAlex Williamson 					return ret;
12689e1f7d4SAlex Williamson 			} else {
127*bc93b9aeSAlex Williamson 				ret = vfio_pci_ioread32(vdev, test_mem,
128*bc93b9aeSAlex Williamson 							&val, io + off);
129*bc93b9aeSAlex Williamson 				if (ret)
130*bc93b9aeSAlex Williamson 					return ret;
13189e1f7d4SAlex Williamson 
13289e1f7d4SAlex Williamson 				if (copy_to_user(buf, &val, 4))
133906ee99dSAlex Williamson 					return -EFAULT;
13489e1f7d4SAlex Williamson 			}
13589e1f7d4SAlex Williamson 
13689e1f7d4SAlex Williamson 			filled = 4;
137906ee99dSAlex Williamson 		} else if (fillable >= 2 && !(off % 2)) {
13807fd7ef3SAlex Williamson 			u16 val;
13989e1f7d4SAlex Williamson 
14089e1f7d4SAlex Williamson 			if (iswrite) {
14189e1f7d4SAlex Williamson 				if (copy_from_user(&val, buf, 2))
142906ee99dSAlex Williamson 					return -EFAULT;
14389e1f7d4SAlex Williamson 
144*bc93b9aeSAlex Williamson 				ret = vfio_pci_iowrite16(vdev, test_mem,
145*bc93b9aeSAlex Williamson 							 val, io + off);
146*bc93b9aeSAlex Williamson 				if (ret)
147*bc93b9aeSAlex Williamson 					return ret;
14889e1f7d4SAlex Williamson 			} else {
149*bc93b9aeSAlex Williamson 				ret = vfio_pci_ioread16(vdev, test_mem,
150*bc93b9aeSAlex Williamson 							&val, io + off);
151*bc93b9aeSAlex Williamson 				if (ret)
152*bc93b9aeSAlex Williamson 					return ret;
15389e1f7d4SAlex Williamson 
15489e1f7d4SAlex Williamson 				if (copy_to_user(buf, &val, 2))
155906ee99dSAlex Williamson 					return -EFAULT;
15689e1f7d4SAlex Williamson 			}
15789e1f7d4SAlex Williamson 
15889e1f7d4SAlex Williamson 			filled = 2;
15989e1f7d4SAlex Williamson 		} else if (fillable) {
16089e1f7d4SAlex Williamson 			u8 val;
16189e1f7d4SAlex Williamson 
16289e1f7d4SAlex Williamson 			if (iswrite) {
16389e1f7d4SAlex Williamson 				if (copy_from_user(&val, buf, 1))
164906ee99dSAlex Williamson 					return -EFAULT;
16589e1f7d4SAlex Williamson 
166*bc93b9aeSAlex Williamson 				ret = vfio_pci_iowrite8(vdev, test_mem,
167*bc93b9aeSAlex Williamson 							val, io + off);
168*bc93b9aeSAlex Williamson 				if (ret)
169*bc93b9aeSAlex Williamson 					return ret;
17089e1f7d4SAlex Williamson 			} else {
171*bc93b9aeSAlex Williamson 				ret = vfio_pci_ioread8(vdev, test_mem,
172*bc93b9aeSAlex Williamson 						       &val, io + off);
173*bc93b9aeSAlex Williamson 				if (ret)
174*bc93b9aeSAlex Williamson 					return ret;
17589e1f7d4SAlex Williamson 
17689e1f7d4SAlex Williamson 				if (copy_to_user(buf, &val, 1))
177906ee99dSAlex Williamson 					return -EFAULT;
17889e1f7d4SAlex Williamson 			}
17989e1f7d4SAlex Williamson 
18089e1f7d4SAlex Williamson 			filled = 1;
18189e1f7d4SAlex Williamson 		} else {
182906ee99dSAlex Williamson 			/* Fill reads with -1, drop writes */
183906ee99dSAlex Williamson 			filled = min(count, (size_t)(x_end - off));
18489e1f7d4SAlex Williamson 			if (!iswrite) {
185906ee99dSAlex Williamson 				u8 val = 0xFF;
18689e1f7d4SAlex Williamson 				size_t i;
18789e1f7d4SAlex Williamson 
188906ee99dSAlex Williamson 				for (i = 0; i < filled; i++)
189906ee99dSAlex Williamson 					if (copy_to_user(buf + i, &val, 1))
190906ee99dSAlex Williamson 						return -EFAULT;
19189e1f7d4SAlex Williamson 			}
19289e1f7d4SAlex Williamson 		}
19389e1f7d4SAlex Williamson 
19489e1f7d4SAlex Williamson 		count -= filled;
19589e1f7d4SAlex Williamson 		done += filled;
196906ee99dSAlex Williamson 		off += filled;
19789e1f7d4SAlex Williamson 		buf += filled;
19889e1f7d4SAlex Williamson 	}
19989e1f7d4SAlex Williamson 
200906ee99dSAlex Williamson 	return done;
201906ee99dSAlex Williamson }
202906ee99dSAlex Williamson 
2030d77ed35SAlex Williamson static int vfio_pci_setup_barmap(struct vfio_pci_device *vdev, int bar)
2040d77ed35SAlex Williamson {
2050d77ed35SAlex Williamson 	struct pci_dev *pdev = vdev->pdev;
2060d77ed35SAlex Williamson 	int ret;
2070d77ed35SAlex Williamson 	void __iomem *io;
2080d77ed35SAlex Williamson 
2090d77ed35SAlex Williamson 	if (vdev->barmap[bar])
2100d77ed35SAlex Williamson 		return 0;
2110d77ed35SAlex Williamson 
2120d77ed35SAlex Williamson 	ret = pci_request_selected_regions(pdev, 1 << bar, "vfio");
2130d77ed35SAlex Williamson 	if (ret)
2140d77ed35SAlex Williamson 		return ret;
2150d77ed35SAlex Williamson 
2160d77ed35SAlex Williamson 	io = pci_iomap(pdev, bar, 0);
2170d77ed35SAlex Williamson 	if (!io) {
2180d77ed35SAlex Williamson 		pci_release_selected_regions(pdev, 1 << bar);
2190d77ed35SAlex Williamson 		return -ENOMEM;
2200d77ed35SAlex Williamson 	}
2210d77ed35SAlex Williamson 
2220d77ed35SAlex Williamson 	vdev->barmap[bar] = io;
2230d77ed35SAlex Williamson 
2240d77ed35SAlex Williamson 	return 0;
2250d77ed35SAlex Williamson }
2260d77ed35SAlex Williamson 
227906ee99dSAlex Williamson ssize_t vfio_pci_bar_rw(struct vfio_pci_device *vdev, char __user *buf,
228906ee99dSAlex Williamson 			size_t count, loff_t *ppos, bool iswrite)
229906ee99dSAlex Williamson {
230906ee99dSAlex Williamson 	struct pci_dev *pdev = vdev->pdev;
231906ee99dSAlex Williamson 	loff_t pos = *ppos & VFIO_PCI_OFFSET_MASK;
232906ee99dSAlex Williamson 	int bar = VFIO_PCI_OFFSET_TO_INDEX(*ppos);
233906ee99dSAlex Williamson 	size_t x_start = 0, x_end = 0;
234906ee99dSAlex Williamson 	resource_size_t end;
235906ee99dSAlex Williamson 	void __iomem *io;
236abafbc55SAlex Williamson 	struct resource *res = &vdev->pdev->resource[bar];
237906ee99dSAlex Williamson 	ssize_t done;
238906ee99dSAlex Williamson 
239a13b6459SAlex Williamson 	if (pci_resource_start(pdev, bar))
240906ee99dSAlex Williamson 		end = pci_resource_len(pdev, bar);
241a13b6459SAlex Williamson 	else if (bar == PCI_ROM_RESOURCE &&
242a13b6459SAlex Williamson 		 pdev->resource[bar].flags & IORESOURCE_ROM_SHADOW)
243a13b6459SAlex Williamson 		end = 0x20000;
244a13b6459SAlex Williamson 	else
245a13b6459SAlex Williamson 		return -EINVAL;
246906ee99dSAlex Williamson 
247906ee99dSAlex Williamson 	if (pos >= end)
248906ee99dSAlex Williamson 		return -EINVAL;
249906ee99dSAlex Williamson 
250906ee99dSAlex Williamson 	count = min(count, (size_t)(end - pos));
251906ee99dSAlex Williamson 
252906ee99dSAlex Williamson 	if (bar == PCI_ROM_RESOURCE) {
253906ee99dSAlex Williamson 		/*
254906ee99dSAlex Williamson 		 * The ROM can fill less space than the BAR, so we start the
255906ee99dSAlex Williamson 		 * excluded range at the end of the actual ROM.  This makes
256906ee99dSAlex Williamson 		 * filling large ROM BARs much faster.
257906ee99dSAlex Williamson 		 */
258906ee99dSAlex Williamson 		io = pci_map_rom(pdev, &x_start);
259abafbc55SAlex Williamson 		if (!io) {
260abafbc55SAlex Williamson 			done = -ENOMEM;
261abafbc55SAlex Williamson 			goto out;
262abafbc55SAlex Williamson 		}
263906ee99dSAlex Williamson 		x_end = end;
2640d77ed35SAlex Williamson 	} else {
2650d77ed35SAlex Williamson 		int ret = vfio_pci_setup_barmap(vdev, bar);
266abafbc55SAlex Williamson 		if (ret) {
267abafbc55SAlex Williamson 			done = ret;
268abafbc55SAlex Williamson 			goto out;
269abafbc55SAlex Williamson 		}
270906ee99dSAlex Williamson 
271906ee99dSAlex Williamson 		io = vdev->barmap[bar];
2720d77ed35SAlex Williamson 	}
273906ee99dSAlex Williamson 
274906ee99dSAlex Williamson 	if (bar == vdev->msix_bar) {
275906ee99dSAlex Williamson 		x_start = vdev->msix_offset;
276906ee99dSAlex Williamson 		x_end = vdev->msix_offset + vdev->msix_size;
277906ee99dSAlex Williamson 	}
278906ee99dSAlex Williamson 
279*bc93b9aeSAlex Williamson 	done = do_io_rw(vdev, res->flags & IORESOURCE_MEM, io, buf, pos,
280*bc93b9aeSAlex Williamson 			count, x_start, x_end, iswrite);
281906ee99dSAlex Williamson 
282906ee99dSAlex Williamson 	if (done >= 0)
28389e1f7d4SAlex Williamson 		*ppos += done;
28489e1f7d4SAlex Williamson 
28589e1f7d4SAlex Williamson 	if (bar == PCI_ROM_RESOURCE)
28689e1f7d4SAlex Williamson 		pci_unmap_rom(pdev, io);
287abafbc55SAlex Williamson out:
288906ee99dSAlex Williamson 	return done;
28989e1f7d4SAlex Williamson }
29084237a82SAlex Williamson 
29184237a82SAlex Williamson ssize_t vfio_pci_vga_rw(struct vfio_pci_device *vdev, char __user *buf,
29284237a82SAlex Williamson 			       size_t count, loff_t *ppos, bool iswrite)
29384237a82SAlex Williamson {
29484237a82SAlex Williamson 	int ret;
29584237a82SAlex Williamson 	loff_t off, pos = *ppos & VFIO_PCI_OFFSET_MASK;
29684237a82SAlex Williamson 	void __iomem *iomem = NULL;
29784237a82SAlex Williamson 	unsigned int rsrc;
29884237a82SAlex Williamson 	bool is_ioport;
29984237a82SAlex Williamson 	ssize_t done;
30084237a82SAlex Williamson 
30184237a82SAlex Williamson 	if (!vdev->has_vga)
30284237a82SAlex Williamson 		return -EINVAL;
30384237a82SAlex Williamson 
30445e86971SArnd Bergmann 	if (pos > 0xbfffful)
30545e86971SArnd Bergmann 		return -EINVAL;
30645e86971SArnd Bergmann 
30745e86971SArnd Bergmann 	switch ((u32)pos) {
30884237a82SAlex Williamson 	case 0xa0000 ... 0xbffff:
30984237a82SAlex Williamson 		count = min(count, (size_t)(0xc0000 - pos));
3104bdc0d67SChristoph Hellwig 		iomem = ioremap(0xa0000, 0xbffff - 0xa0000 + 1);
31184237a82SAlex Williamson 		off = pos - 0xa0000;
31284237a82SAlex Williamson 		rsrc = VGA_RSRC_LEGACY_MEM;
31384237a82SAlex Williamson 		is_ioport = false;
31484237a82SAlex Williamson 		break;
31584237a82SAlex Williamson 	case 0x3b0 ... 0x3bb:
31684237a82SAlex Williamson 		count = min(count, (size_t)(0x3bc - pos));
31784237a82SAlex Williamson 		iomem = ioport_map(0x3b0, 0x3bb - 0x3b0 + 1);
31884237a82SAlex Williamson 		off = pos - 0x3b0;
31984237a82SAlex Williamson 		rsrc = VGA_RSRC_LEGACY_IO;
32084237a82SAlex Williamson 		is_ioport = true;
32184237a82SAlex Williamson 		break;
32284237a82SAlex Williamson 	case 0x3c0 ... 0x3df:
32384237a82SAlex Williamson 		count = min(count, (size_t)(0x3e0 - pos));
32484237a82SAlex Williamson 		iomem = ioport_map(0x3c0, 0x3df - 0x3c0 + 1);
32584237a82SAlex Williamson 		off = pos - 0x3c0;
32684237a82SAlex Williamson 		rsrc = VGA_RSRC_LEGACY_IO;
32784237a82SAlex Williamson 		is_ioport = true;
32884237a82SAlex Williamson 		break;
32984237a82SAlex Williamson 	default:
33084237a82SAlex Williamson 		return -EINVAL;
33184237a82SAlex Williamson 	}
33284237a82SAlex Williamson 
33384237a82SAlex Williamson 	if (!iomem)
33484237a82SAlex Williamson 		return -ENOMEM;
33584237a82SAlex Williamson 
33684237a82SAlex Williamson 	ret = vga_get_interruptible(vdev->pdev, rsrc);
33784237a82SAlex Williamson 	if (ret) {
33884237a82SAlex Williamson 		is_ioport ? ioport_unmap(iomem) : iounmap(iomem);
33984237a82SAlex Williamson 		return ret;
34084237a82SAlex Williamson 	}
34184237a82SAlex Williamson 
342*bc93b9aeSAlex Williamson 	/*
343*bc93b9aeSAlex Williamson 	 * VGA MMIO is a legacy, non-BAR resource that hopefully allows
344*bc93b9aeSAlex Williamson 	 * probing, so we don't currently worry about access in relation
345*bc93b9aeSAlex Williamson 	 * to the memory enable bit in the command register.
346*bc93b9aeSAlex Williamson 	 */
347*bc93b9aeSAlex Williamson 	done = do_io_rw(vdev, false, iomem, buf, off, count, 0, 0, iswrite);
34884237a82SAlex Williamson 
34984237a82SAlex Williamson 	vga_put(vdev->pdev, rsrc);
35084237a82SAlex Williamson 
35184237a82SAlex Williamson 	is_ioport ? ioport_unmap(iomem) : iounmap(iomem);
35284237a82SAlex Williamson 
35384237a82SAlex Williamson 	if (done >= 0)
35484237a82SAlex Williamson 		*ppos += done;
35584237a82SAlex Williamson 
35684237a82SAlex Williamson 	return done;
35784237a82SAlex Williamson }
35830656177SAlex Williamson 
35930656177SAlex Williamson static int vfio_pci_ioeventfd_handler(void *opaque, void *unused)
36030656177SAlex Williamson {
36130656177SAlex Williamson 	struct vfio_pci_ioeventfd *ioeventfd = opaque;
36230656177SAlex Williamson 
36330656177SAlex Williamson 	switch (ioeventfd->count) {
36430656177SAlex Williamson 	case 1:
365*bc93b9aeSAlex Williamson 		vfio_pci_iowrite8(ioeventfd->vdev, ioeventfd->test_mem,
366*bc93b9aeSAlex Williamson 				  ioeventfd->data, ioeventfd->addr);
36730656177SAlex Williamson 		break;
36830656177SAlex Williamson 	case 2:
369*bc93b9aeSAlex Williamson 		vfio_pci_iowrite16(ioeventfd->vdev, ioeventfd->test_mem,
370*bc93b9aeSAlex Williamson 				   ioeventfd->data, ioeventfd->addr);
37130656177SAlex Williamson 		break;
37230656177SAlex Williamson 	case 4:
373*bc93b9aeSAlex Williamson 		vfio_pci_iowrite32(ioeventfd->vdev, ioeventfd->test_mem,
374*bc93b9aeSAlex Williamson 				   ioeventfd->data, ioeventfd->addr);
37530656177SAlex Williamson 		break;
37630656177SAlex Williamson #ifdef iowrite64
37730656177SAlex Williamson 	case 8:
378*bc93b9aeSAlex Williamson 		vfio_pci_iowrite64(ioeventfd->vdev, ioeventfd->test_mem,
379*bc93b9aeSAlex Williamson 				   ioeventfd->data, ioeventfd->addr);
38030656177SAlex Williamson 		break;
38130656177SAlex Williamson #endif
38230656177SAlex Williamson 	}
38330656177SAlex Williamson 
38430656177SAlex Williamson 	return 0;
38530656177SAlex Williamson }
38630656177SAlex Williamson 
38730656177SAlex Williamson long vfio_pci_ioeventfd(struct vfio_pci_device *vdev, loff_t offset,
38830656177SAlex Williamson 			uint64_t data, int count, int fd)
38930656177SAlex Williamson {
39030656177SAlex Williamson 	struct pci_dev *pdev = vdev->pdev;
39130656177SAlex Williamson 	loff_t pos = offset & VFIO_PCI_OFFSET_MASK;
39230656177SAlex Williamson 	int ret, bar = VFIO_PCI_OFFSET_TO_INDEX(offset);
39330656177SAlex Williamson 	struct vfio_pci_ioeventfd *ioeventfd;
39430656177SAlex Williamson 
39530656177SAlex Williamson 	/* Only support ioeventfds into BARs */
39630656177SAlex Williamson 	if (bar > VFIO_PCI_BAR5_REGION_INDEX)
39730656177SAlex Williamson 		return -EINVAL;
39830656177SAlex Williamson 
39930656177SAlex Williamson 	if (pos + count > pci_resource_len(pdev, bar))
40030656177SAlex Williamson 		return -EINVAL;
40130656177SAlex Williamson 
40230656177SAlex Williamson 	/* Disallow ioeventfds working around MSI-X table writes */
40330656177SAlex Williamson 	if (bar == vdev->msix_bar &&
40430656177SAlex Williamson 	    !(pos + count <= vdev->msix_offset ||
40530656177SAlex Williamson 	      pos >= vdev->msix_offset + vdev->msix_size))
40630656177SAlex Williamson 		return -EINVAL;
40730656177SAlex Williamson 
40830656177SAlex Williamson #ifndef iowrite64
40930656177SAlex Williamson 	if (count == 8)
41030656177SAlex Williamson 		return -EINVAL;
41130656177SAlex Williamson #endif
41230656177SAlex Williamson 
41330656177SAlex Williamson 	ret = vfio_pci_setup_barmap(vdev, bar);
41430656177SAlex Williamson 	if (ret)
41530656177SAlex Williamson 		return ret;
41630656177SAlex Williamson 
41730656177SAlex Williamson 	mutex_lock(&vdev->ioeventfds_lock);
41830656177SAlex Williamson 
41930656177SAlex Williamson 	list_for_each_entry(ioeventfd, &vdev->ioeventfds_list, next) {
42030656177SAlex Williamson 		if (ioeventfd->pos == pos && ioeventfd->bar == bar &&
42130656177SAlex Williamson 		    ioeventfd->data == data && ioeventfd->count == count) {
42230656177SAlex Williamson 			if (fd == -1) {
42330656177SAlex Williamson 				vfio_virqfd_disable(&ioeventfd->virqfd);
42430656177SAlex Williamson 				list_del(&ioeventfd->next);
42530656177SAlex Williamson 				vdev->ioeventfds_nr--;
42630656177SAlex Williamson 				kfree(ioeventfd);
42730656177SAlex Williamson 				ret = 0;
42830656177SAlex Williamson 			} else
42930656177SAlex Williamson 				ret = -EEXIST;
43030656177SAlex Williamson 
43130656177SAlex Williamson 			goto out_unlock;
43230656177SAlex Williamson 		}
43330656177SAlex Williamson 	}
43430656177SAlex Williamson 
43530656177SAlex Williamson 	if (fd < 0) {
43630656177SAlex Williamson 		ret = -ENODEV;
43730656177SAlex Williamson 		goto out_unlock;
43830656177SAlex Williamson 	}
43930656177SAlex Williamson 
44030656177SAlex Williamson 	if (vdev->ioeventfds_nr >= VFIO_PCI_IOEVENTFD_MAX) {
44130656177SAlex Williamson 		ret = -ENOSPC;
44230656177SAlex Williamson 		goto out_unlock;
44330656177SAlex Williamson 	}
44430656177SAlex Williamson 
44530656177SAlex Williamson 	ioeventfd = kzalloc(sizeof(*ioeventfd), GFP_KERNEL);
44630656177SAlex Williamson 	if (!ioeventfd) {
44730656177SAlex Williamson 		ret = -ENOMEM;
44830656177SAlex Williamson 		goto out_unlock;
44930656177SAlex Williamson 	}
45030656177SAlex Williamson 
451*bc93b9aeSAlex Williamson 	ioeventfd->vdev = vdev;
45230656177SAlex Williamson 	ioeventfd->addr = vdev->barmap[bar] + pos;
45330656177SAlex Williamson 	ioeventfd->data = data;
45430656177SAlex Williamson 	ioeventfd->pos = pos;
45530656177SAlex Williamson 	ioeventfd->bar = bar;
45630656177SAlex Williamson 	ioeventfd->count = count;
457*bc93b9aeSAlex Williamson 	ioeventfd->test_mem = vdev->pdev->resource[bar].flags & IORESOURCE_MEM;
45830656177SAlex Williamson 
45930656177SAlex Williamson 	ret = vfio_virqfd_enable(ioeventfd, vfio_pci_ioeventfd_handler,
46030656177SAlex Williamson 				 NULL, NULL, &ioeventfd->virqfd, fd);
46130656177SAlex Williamson 	if (ret) {
46230656177SAlex Williamson 		kfree(ioeventfd);
46330656177SAlex Williamson 		goto out_unlock;
46430656177SAlex Williamson 	}
46530656177SAlex Williamson 
46630656177SAlex Williamson 	list_add(&ioeventfd->next, &vdev->ioeventfds_list);
46730656177SAlex Williamson 	vdev->ioeventfds_nr++;
46830656177SAlex Williamson 
46930656177SAlex Williamson out_unlock:
47030656177SAlex Williamson 	mutex_unlock(&vdev->ioeventfds_lock);
47130656177SAlex Williamson 
47230656177SAlex Williamson 	return ret;
47330656177SAlex Williamson }
474